最近写博客比较多,但发现文章被一些网站转载后,排名比博客园的链接还要高,有些搜索引擎甚至连博客园的链接都没有,坑爹,坑爹。。。
以前博客园的网友也遇到过类似的情况,也分享过一些防转载的经验,不过太麻烦,懒得去搞。看看几个截图。
1.以前几天发表的一篇.NET机器学习组件Infer.NET的为例
博客园原文链接:http://www.cnblogs.com/asxinyu/p/4252769.html
原文标题名称:【原创】.NET平台机器学习组件-Infer.NET连载(一)介绍-【附最新源码】,相比刚发表,标题稍微有些变动
该文章目前的访问量是:1457
我以关键字:“.NET平台机器学习组件-Infer.NET连载” 来搜索:(谷歌被墙,没办法对比)
360好搜 + 百度 + Bing搜索,看结果
结果是,3个搜索引擎第一页都没有 原始网页 ;而360(8)和Bing(6)显示的同一篇文章内容的结果数量要多余大大多于百度(2)。
换了其他几个关键词,感觉360和Bing的结果差不多,唯一的百度就TM是一坨屎。。。
2.以2014年的一篇利用马尔可夫链预测彩票的文章
原文名称:彩票数据预测算法(一):离散型马尔可夫链模型实现
原文链接:http://www.cnblogs.com/asxinyu/p/3532076.html
该文章目前的访问量是:6174
搜索关键词:"彩票 离散型马尔可夫链模型实现"
360好搜 + 百度 + Bing搜索,看结果
这一次结果又非常好,原始网页都排在了第一,其他一些爬虫的站都排在了后面。
比较结果360和百度对该内容相同的文章首页的结果数量一样,但位置稍微有差别,而且引用的网页也有所不同,Bing只有唯一一个结果。
3.排名难道和原始链接的访问量有关系?
2篇时间不同的文章,搜索的结果差别挺大,是不是原始网页的访问量越大,权重越高?所以靠前,但文章刚发表的,其他站也不应该有很大的访问量啊。
有点搞不懂,这些个爬虫,伪原创,防不胜防,实在头疼,还好大部分都引用了原始链接。大家有啥好对策,呵呵。
再吐槽一句:百度是越来越屎。。。。
本博客还有大量的.NET开源技术文章,您可能感兴趣:
1.开源Math.NET基础数学类库使用系列文章:链接
2.开源C#彩票数据资料库系列文章:链接
3.开源的.NET平台ORM组件文章:链接
4.其他开源的.NET组件文章:链接
5..NET平台机器学习组件-Infer.NET系列文章:链接
6.Matlab混合编程文章:链接