作为 SEO 专家,我们对 Google 非常了解。算法更新通常基于已发布的专利。更新的根本目的是消除可疑的 SEO 做法。
我们所说的不正当行为是指任何试图利用 Google 算法的弱点来获得更高搜索引擎排名的行为。谷歌会惩罚这样做的网站,因为其搜索结果页面上向用户提供的内容通常质量较差,这意味着搜索引擎结果也会受到影响。
任何玩过 SEO 游戏几年的人都很清楚Google 惩罚的主要黑帽策略(我们将在文章后面看一些具体的例子)。
快速阅读:你应该了解的 3 项 Google 专利,以避免 SEO 处罚
- 2013 年 10 月 8 日的“内容旋转”专利:自动重写相同的页面以避免重复内容。
- 2011 年 12 月 13 日的“关键词填充”专利:利用关键词饱和度将网站定位在单个单词上。
- 2013 年 3 月 5 日的“隐形”专利: whatsapp 号码 隐藏内容以欺骗算法。
什么谷歌识别黑帽策略如此重要?
因为您不想意外犯下 SEO 错误而导致 Google 惩罚您。他们会认为你正在试图利用这个系统。
事实上,您只是因为不知道而犯了 为您的电子商务网站创建有效内容的完整指南 一些代价高昂的 SEO 错误。为了更好地理解谷歌的算法如何识别不良的 SEO 做法(从而更好地了解如何避免犯 SEO 错误),您应该查看谷歌与一些最常见的黑帽策略相关的专利。
内容旋转
涉案专利:“识别资源中的乱码内容”(专利日期为 2013 年 10 月 8 日)[1]
为了增加链接数和流量,网站会数百次重写同一篇文章, ig 号码 避免其被视为重复内容。一些网站甚至利用广告链接通过此类内容来创造收入。
然而,由于内容重写是一项相当繁琐的任务,许多网站转向能够自动替换名词和动词的自动写作软件。这通常会导致创建质量非常差的内容,或者换句话说,乱码。
该专利解释了谷歌如何通过识别网页上包含的难以理解或不正确的短语来检测此类内容。 Google 使用的系统根据多种因素为某个网页分配上下文分数:这被称为“乱码分数”。
Google 使用一种语言模型,可以识别出某个单词序列是否是人造的。实际上,它会识别并分析页面上的不同 n-gram,并将它们与其他网站上的其他 n-gram 组进行比较。 n-gram 是元素(在本例中为单词)的连续序列。
从那里,谷歌生成语言模型分数和查询填充分数。这是内容中某些术语的重复频率。这些分数相加就可以计算出乱码分数。对后者进行分析,以确定是否应该修改结果页面上的内容的位置。
关键词填充
涉案专利:“在基于短语的信息检索系统中检测垃圾文档”(2011 年 12 月 13 日)[2]
很多页面一度包含很少甚至没有有用的信息,因为它们将关键词串在一起而没有考虑句子的含义。谷歌的算法更新使其终止了这一策略。
该专利
Google 根据完整句子索引网页的方式极其复杂。解决这项专利(顺便说一句,这不是关于这个主题的唯一专利)是了解关键词对索引的影响的第一步。
Google 的句子理解系统可以分为三个阶段:
- 系统收集所使用的表达方式以及与其频率和共现相关的统计数据。
- 然后,他根据收集到的频率统计数据将它们分为好或坏。
- 最后,利用系统根据词语共现相关统计数据建立的预测指标,细化被认为是好的表达列表的内容。
谷歌用来执行这些步骤的技术可能会带来麻烦。那么,让我们直奔主题吧。
这个系统如何让 Google 识别关键词堆砌的情况?
除了能够确定给定文档中使用了多少个关键字(显然,关键字密度为 50% 的文档就是关键字填充的情况)之外,Google 还可以衡量与关键字相关的表达式的数量(这些是 LSI 关键字)。
据谷歌称,正常文档通常包含 8 到 20 个相关短语,而使用垃圾邮件方法的文档则包含 100 个甚至多达 1,000 个。
通过比较使用相同关键词和相关短语的文档的统计数据,Google 可以确定某个文档使用的关键词和相关短语数量是否高于平均水平。