seo怎么碰撞规避算法百度的核心算法?

 做网络营销做SEO的朋友都清楚搜索引擎抓去收录都一个算法就好比我们做一款产品时要添加设备码是一样的,有一定的规则在里面对于搜索引擎算法,它直接决定你茬搜索引擎的排名和搜索自然流量的多少了解搜索引擎算法也成了每一位网站优化的朋友必修一门课。
  外链是搜索引擎算法中判斷网站权重高低的重要指标,当用户在搜索框中输入关键时搜索引擎面对大量拥有相同内容的网页,首先需要解决的就是通过哪些 参數觉得网页排名的高低。今天笔者就简单介绍外链建设中,比较有名的核心算法:PageRank算法、Hilltop算法、Direct Hit 算法
  1998年,Sergey Brin和Lawrence Page提出了PageRank算法该算法基于“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系来判定网页的重要性。该算法认为从网 页A导向网页B的链接可鉯看作是页面A对页面B的支持投票根据这个投票数来判断页面的重要性。当然不仅仅只看投票数,还要对投票的页面进行重要性分 析樾是重要的页面所投票的评价也就越高。根据这样的分析得到了高评价的重要页面会被给予较高的PageRank值,在检索结果内的名次也会提高 PageRank昰基于对“使用复杂的算法而得到的链接构造” 的分析,从而得出的各网页本身的特性
  分 析:PageRank算法的优点在于它对互联网上的网页給出了一个全局的重要性排序,并且算法的计算过程是可以离线完成的这样有利于迅速响应用户的请 求。不过其缺点在于主题无关性,没有区分页面内的导航链接、广告链接和功能链接等容易对广告页面有过高评价;另外,PageRank算法的另一弊端 是旧的页面等级会比新页面高,因为新页面即使是非常好的页面,也不会有很多链接除非他是一个站点的子站点。这就是PageRank需要多项算法结合 的原因
  HillTop,是一項搜索引擎 结果排序的专利是Google的一个工程师Bharat在2001年获得的专利。HillTop算法的指导思想和PageRank是一致的即都通过反 向链接的数量和质量来确定搜索結果的排序权重。但HillTop认为只计算来自具有相同主题的相关文档链接对于搜索者的价值会更大即主题相关网页之间的 链接对于权重计算的貢献比主题不相关的链接价值要更高。在年当这个算法被Bharat与其他Google开发人员开发出来的时候,他 们称这种对主题有影响的文档为“专家”攵档而只有从这些专家文档页面到目标文档的链接决定了被链接网页“权重得分”的主要部分。
  Hilltop算法的过程:首先计算查询主题最楿关的“专家”资源列表;其次在选中的“专家”集中识别相关的链接并追踪它们以识别相关的网页目标;然 后将目标根据非关联的指向它們的“专家”数量和相关性排序。由此目标网页的得分反映了关于查询主题的最中立的专家的集体观点。如果这样的专家池不存 在Hilltop不會给出结果。
  从Hilltop算法过程可见该算法包括两个主要的方面:寻找专家;目标排序。通过对搜索引擎抓取的网页进行预处理找出专家頁面。对于一个关键词的查询首先在专家中查找,并排序返回结果
  权威页面是对于一个查询主题来说最好的专家指向的页面。专镓也有可能在更宽泛的领域或其它领域的主题上也是专家在专家页面中只有一部分链接与主题相关。因此把查询主题的专家中相关的外向链接合并,以找到查询主题相关页面高度认可的页面
  从排名在前的匹配专家页面和相联系的匹配信息中选择专家页面中一个超鏈接的子集。尤其选择那些与所有的查询相关的链接基于这些选中的链接找出一个它们 的目标子集作为查询主题最相关的网页。这个目標子集包含至少被两个非亲属的专家页面链接到的网页目标集根据指向它们的专家的综合成绩来排序。
  Hilltop在应用中还存在一些不足專家页面的搜索和确定对算法起关键作用,专家页面的质量决定了算法的准确性;而专家页面的质量和公平性在一定程 度上难以保证Hiltop忽略叻大多数非专家页面的影响。在Hiltop的原型系统中专家页面只占到整个页面的1.79%,不能全面代表整个互联网
  Hiltop算法在无法得到足够的专家頁面子集时(少于两个专家页面),返回为空即Hiltop适合于对查询排序进行求精,而不能覆盖这意味着 Hilltop可以与某个页面排序算法结合,提高精喥而不适合作为一个独立的页面排序算法。Hilltop中根据查询主题从专家页面集合中选取与主题相 关的子集也是在线运行的这与前面提到的HITS算法一样会影响查询响应时间。随着专家页面集合的增大算法的可伸缩性存在不足之处。
  分析:HITS算法的优点在于它能更好地描述互聯网的组织特点由于它只是对互联网中的很小的一个子集进行分析,所以它需要的迭代次数更少收敛速度更快,减少了时间复杂度
  但HITS算法也存在如下缺点:中心网页之间的相互引用以增加其网页评价,当一个网站上的多篇网页指向一个相同的链接或者一个网页指向另一个网站上的多个文件时会引起评分的不正常增加,这会导致易受“垃圾链接”的影响;网页中存在自动生成的链接;
  主题漂移茬邻接图中经常包括一些和搜索主题无关的链接,如果这些链接自身也是中心网页或权威网页就会引起主题漂移:对于每个不同的查询算法都需要重新运行一次来获取结果这使得它不可能用于实时系统,因为对于上千万次的并发查询这样的开销实在太大
  算法与前面嘚算法相比,Ask Jeeves公司的Direct Hit算法是一种注重信息的质量和用户反馈的排序方法它的基本思想是,搜索引擎将查询的结果返回给用户并跟踪用戶在检索结果中的点击。如果返回结果中 排名靠前的网页被用户点击后浏览时间较短,用户又重新返回点击其它的检索结果那么可以認为其相关度较差,系统将降低该网页的相关性另一方面,如果网 页被用户点击打开进行浏览并且浏览的时间较长,那么该网页的受歡迎程度就高相应地,系统将增加该网页的相关度可以看出,在这种方法中相关度在不停 地变化,对于同一个词在不同的时间进行檢索得到结果集合的排序也有可能不同,它是一种动态排序
  分析:该算法的优点是能够节省大量时间,因为用户阅读的是从搜索結果中筛选出来的更加符合要求的结果同时,这种算法直接融入用户的反馈信息能够保证页面的质量。
  然而统计表明,Direct Hit算法只適合于检索关键词较少的情况因为它实际上并没有进行排序,而是一种筛选和抽取在检索数据库很大、关键词很多的时候,返回的搜索结果成千上 万用户不可能一一审阅。因此这种方式也不能作为主要的排序算法来使用,而是一种很好的辅助排序算法目前在许多搜索引擎当中仍然在使用。
  其实对于网页的搜索排名都是多种算法综合作用的结果,简单分析上面的三种算法Pagerank可以给网站上的所囿网页给予一个重要性的排序,但是没有针对性、相关性而且现在PR值作弊已经到了一个泛滥的地步,所以PR就网页排名的重要性已经大为丅降;
  Hilltop算法的提出对于广大站长做外部链接建设,将起到指导作用在Hilltop算法中,每个领域都会有若干专家页面如果搜索相关关键词,搜索引擎首先会从专家页面查找如果匹配度不够,再从专家页面链接的下一级页面查找以此类推。
  Direct Hit算法可以作为Hilltop和pagerank很好的补充Direct Hit更多的是,考虑了用户体验的影响对搜索结果的质量,进行实时的更新一个最符合搜索用户要求的页面,应该是用户从搜索框中点擊页面链接开始用户 浏览网站超过一定时间,则被认为结果页面更符合用户搜索的要求,长期有效的点击页面在搜索引擎中排名,僦会有相应的提高
  通过以上三种算法,就可以明白无论是做外链还是网站内容建设,首先需要考虑的就是相关性在外链建设中,要努力寻找主题相关中权威度高的网站,软 文、友情链接等都可以看作是这些网站,对你的支持同时,注意网站的跳出率和浏览時间时刻反馈用户数据,对一些重点页面用户点击量较高的页面,做好 相关性推荐引导用户点击更多的页面。
  搜索引擎核心算法始终不会脱离这些内容每次的算法更新都是从一些作弊源头经行改动,也正是因为搜索引擎算法的不断变化也造就了很多正规网站嘚排名也越来越好做,尽管搜索引擎越来越完善但始终会有人去研究搜索引擎漏洞来获取排名。

??2013年2月19日上线影响了10W+低质站點。

??之所以叫绿萝是因为百度大厦中有很多绿萝,用来净化空气而互联网的空气也需要好好净化。

??绿萝算法——打击买卖链接的行为包括超链中介、出卖链接的网站、购买链接的网站

??2013年5月17日上线,当时开发算法的RD哥哥和PM妹妹一个姓“石”一个姓“刘”,想想好有爱的名字

??石榴算法——打击大量妨碍用户正常浏览的恶劣广告的页面

??2013年7月1日上线,时隔不到半年绿萝升级了!

??綠萝算法2.0——加大力度过滤软文中的外链及惩罚发软文的站点

??然后,2015年外链没用了!!! 这下干净利落了!

??2014年8月30日上线,百度移动搜索潑出的“冰”冻哭了近10W相关移动站!

??冰桶算法——打击强行弹窗app下载、大面积广告等影响用户正常浏览体验的页面

??2014年11月18日上线,苐二桶冰让寒意更加凛冽

??冰桶算法2.0——打击全屏下载、在狭小的手机页面布设大面积广告遮挡主体内容、强制用户登录的行为

??2016姩7月15日上线,严厉打击在百度移动搜索中打断用户完整搜索路径的调起行为。

??恶劣广告包括但不限于如下举例:

??打击恶意抓取鼡户信息

??百度网页搜索发现部分站点存在盗取用户隐私的行为主要表现为网页嵌恶意代码,用于盗取网民的QQ号、手机号而许多网囻却误认为这是百度所为。为此百度网页搜索和百度安全联合研发天网算法,针对这种恶意行为进行打击有过盗取用户隐私行为的站點请尽快整改,待策略复查达到标准可解除惩罚

??2016.12打击低质量新闻源。

??2017.9 打击标题作弊

??2017.10 移动端优化核心—访问速度(MIP)

??2017.11 打击网站流量作弊(刷流量)

我要回帖

更多关于 碰撞规避算法 的文章

 

随机推荐