赠送体验金的娱乐城
官网
Portraits
Journal
Contact
上周百度发布了一篇“谈外链判断”的文章,并且留下了一句:“百度判断一个外链是否为问题外链的唯一原则:是否是用户或者其他网站的真心推荐,是否具体高质量的推荐意义。”这样的话。
那么什么才是百度所谓的“是否是用户或者其他网站的真心推荐,是否具体高质量的推荐意义”呢?这个估计只有百度自己知道,我也只能是猜测。
那么如何靠谱一点的猜测呢?
我们先假设一个前提,就是百度认为“是否是用户或者其他网站的真心推荐,是否具体高质量的推荐意义”这个判断的依据是基于机器算法,而不是人工审核,我相信是这样的,否则我想象不到百度要花费多少人工。
如果百度是使用机器算法,那么程序是如何判断的呢?
我们先看下在什么情况下用户会真心推荐一个连接:
1. 提问时,比如“正则表达式”说明,可能有人回答了一些问题后,给出了一个w3cshool的url..
2.某职业的网站在引用了某篇原创的新闻或文章后,留下转自的url…
3.在阐述某些问题时,需要引用一些佐证时,会留下引用的一些url…
4,在阐述一些问题时,需要留下一些资源的入口…
等还有很多其他的情况,就不一一列举了。
我们都会发现,凡是主动有价值的留连接的都是有一些特征的,比如连接的网页与当前页面内容的相关性,被引用页面本身的引用的广泛度。
那么机器是如何判断这些因素的呢?我说的这些算法都是已知存在的,只有我不知道的算法,而我所知道的,已经可以做一些判断了。
1,语义分析,当前页面的正文内容与引用地址的相关性,无论是文章,博客,论坛,搜索引擎区分正文的能力已经不容置疑, 那么你在回复内容中的连接,签名上的连接,就为了发链接而产生的回复,本身搜索引擎是能够判断的到的。
2,相似度分析,大量的文章是被转载的,转载的引用url是可以通过文章的相似度进行判断的,那么一篇文章如果被大量的网站转载,就会出现两个情况,一个是自己的站群,一个是真实被转载,而搜索引擎可以同连接流行度来区分,对于有高权重网站转载的是否应该信任呢?貌似就是PAGERANK么?
3,HITS算法,这个尽管很老了,但是还是比较有用的,如果在一些权重较高的网站出现的连接,那么 基于Authority/Hub的理论,也是可以给内容里的url进行一些加分或判断的。
4. 一些我还没想到的算法,以后补充。
总之,基于目前已知的算法,搜索引擎是基本能判断出那些用户主动推送的一些外链信息的,那么换句话说如果是使用这些算法进行外链质量的判断,那么你也就应该能够理解百度所说的什么垃圾外链,评论外链,签名外链的问题了,同时是不是你也知道应该怎么 对付这种算法了呢?
官网
Portraits
Journal
Contact