切它网B2B商人社区(Club.QieTa.com)
标题:
蜘蛛眼中的原创文章
[打印本页]
作者:
syswfw
时间:
2013-1-6 00:36
标题:
蜘蛛眼中的原创文章
网站内容是否原创直接影响搜索引擎对你网站的收录、和快照更新的情况,广州商诺企业在前文中多次提到原创内容对网站的好处。一般我们网站的内容有原创、伪原创、转载他人文章(复制粘贴)。下面我们着重讲讲搜索引擎是如何判断内容是否原创、和伪原创。
收录及收录时间
我们在某一网站上发布了一篇文章内容,搜索引擎蜘蛛爬取到这个网站并且收录了这篇内容。那么搜索引擎会把收录的这篇文章在数据库里类似的文章做对比,没有发现以前有记录的,搜索引擎就会认为是原创内容。注意,这建立在文章被收录的情况下,如果文章都没有被收录,就更谈不上什么原创了。
如果刚发表的一篇文章被其他网站转载了,那就要看谁先被搜索引擎收录了,例如:A站发表文章,B站转载了,如果先收录A站,那么就原创文章归A站,如果先抓取到B站,那么原创文章就是B站的了,并不是说你先发表了就是谁的,这个得看搜索引擎什么时间收录这篇文章。而如果B站转载的时候带上了A站的原文页面链接的话,刚开始还是B站的获得的权重会高一点,当然,文章转载次数多了以后,A站的链接越来越多,A站的权重获得自然会比B站高。
快照日期
有人说我的快照日期显示的时间最早,一般就是原创了吧,这个说法要在一个更新周期之内的,比如说文章发表后一周内,快照时间越早的地址将越有被认为是原创的可能性,但还有另一种情况。一般搜索引擎收录后,会有一个收录的数据库,经过过滤后,收录的内容才会到搜索结果中来,在这个期间就有一些问题了,比如A站首发的原创内容,B站转载。蜘蛛先访问A站再访问B站,而后有可能先把B站的结果放出来了,而A站还在数据库中。所以说搜索引擎没有收录并不表示搜索引擎蜘蛛没有访问过这些内容,也许在搜索引擎的数据库中已经有记录了,只是你查的时候,还没放出来而已。这种情况,一般出现在新站和老站之间,新站首发,老站转载,新站在搜索引擎的信任度并不高。但只要是新站先被抓取到,原创权还是新站的,这是最难分出来的情况。因为我们不知道蜘蛛先访问哪个站点的。除非你能打开两个站点的IIS日志进行分析对比。才能看到搜索引擎对这篇文章的访问时间。
伪原创(在这里略微的提及一下伪原创需要注意的地方)
所谓伪原创很多人从字面上都能理解,就是加工,伪的。把一篇文章进行再加工。让搜索引擎认为这是一篇原创的文章。
伪原创一定得修改标题,标题修改了,可以降低搜索引擎中数据库的重复度。但也得注意,修改标题只是达到换汤不换药的效果,你把标题的意思都改了这样就失去了伪原创的初衷了。我们都知道,一篇好的文章,其正文是围绕着标题而展开的,标题也是文中的中心思想。
至于伪原创的标题和正文内容的修改方法,百度一下会出现N多种,比如首段总结法、尾部总结法、段落替换法、等等。在这里广州商诺企业htp://gzsn.com.cn就不过多的描述了。
欢迎光临 切它网B2B商人社区(Club.QieTa.com) (http://club.qieta.com/)
Powered by Discuz! X3.2