关于网站的重复内容,个建议

一直很在意网站重复内容的影响和规范,今天在朱健飞的博客上看到了关于重复内容的描述,之前已经有读过英文版本,这次的中文翻译非常好读,以下是全文外加C.DL的心得:)最近,搜索引擎战略会议在寒冷的芝加哥举行

网站优化建议

许多谷歌参加者总是被问及关于重复内容的问题

对于这个话题,我们发现有许多破碎的并且有些混乱的理解

我们想在此予以澄清

什么是内容重复

重复的内容一般是指在不同域名间存在大量的相同或相似的内容

很多时候,它并非故意或至少本无恶意

譬如说,有些论坛会生成一些专为屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的URL上,等等

关于网站优化

但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容

网站优化

(C.DL:一般网站的重复内容有种情况,网站本身的内容重复;网站因为URL的设置问题导致的内容重复;网站内容采集)什么不是重复内容

虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制

同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容

(C.DL:大片段的引用算不算呢

这篇文章算不算重复内容呢)为什么谷歌关心重复内容

谷歌用户使用G时通常希望看到多样化的原创内容

如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人

另外,网站管理员不愿意看到G给出象.和.的内部链接.

(C.DL:可以将.用重定向到)、使用顶级域名:为了让我们总是使用最合适的文件版本,请尽可能使用国家特定的顶级域名

与诸如.或..的URL相比,谷歌肯定更清楚地知道.是以德文为核心的内容

、小心辛迪加式的联合供文:如果你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接

注意:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本,它可能是,也有可能不是你所想要的版本

、使用谷歌网站管理员工具的首选域功能:如果其他网站链接你的URL时既使用版本又使用无的版本,你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式

、减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明

另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页

、避免发布无内容页:用户不喜欢看到无实际内容的页面

要尽量避免空架页

以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等

只有这样,网站用户(以及G爬虫)才不会看到无穷多的写着以下是在【某城市名】中不可错失的待租房列表但其实根本没有什么列表的网页

、了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统

往往在这些系统中同一内容会以多种形式出现

、不要担心,保持快乐:不要过分受搜刮(挪用和转载)你内容站点的干扰

虽然很恼人,它们几乎不可能对你在谷歌中的存在产生负面影响

如果你实在忍无可忍,欢迎你提出千禧年著作权法案申请来声明对你的内容的所有权

我们会处理那些无赖网站

总之,如果你对内容复制问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容

Top