本文会简明扼要的给大家阐述谷歌搜索引擎的运作原理。其中会涉及一部分外网资料。部分外网资料需要科学上网才可以访问。本文阅读时间预计20分钟。
当我们在使用谷歌进行关键词搜索的时候,很多人会认为我们是在搜索整个互联网。其实我们真实在搜索的是谷歌的网页索引库。
谷歌是如何将这些页面展现在用户面前的?其实谷歌会使用一个叫做 “蜘蛛(Spider, Bot)”的程序抓取互联网上的各类网站,并将这些网站信息整理,并合理归类,储存在谷歌自己的数据库中。
与此同时,谷歌会根据一系列的算法来计算各个网页的价值,例如:和哪个关键词相关,有多少链接指向,权重等等。同时预先按照某个分数大小排列好这些页面。
当用户搜索某个关键词词的时候,谷歌会将事先通过算法排列好的网站顺序展现在用户面前。展现出来的这个结果页面就是我们SEO人经常提到的SERP页面,即搜索引擎结果页面。
2020年10月更新:这里说法有误解。部分搜索结果中展示的是预存的数据,而部分结果几乎接近于实时展示。(当然任何进入索引并展示的都是经过谷歌计算的)
谷歌蜘蛛的工作原理
“蜘蛛”程序先是抓取少量网页。然后跟踪这些网页上的链接,接着抓取这些链接指向的网页。再跟踪这些网页上的所有链接,并抓取它们链接到的网页,以此类推类。好比我们经常说的 “顺藤摸瓜”。
谷歌算法的工作原理
算法如刚才所述,是谷歌用来评价你的网站/网页质量的一个标准。搜索引擎会通过很多维度进行判断,例如:
- 关键词在此网页上出现了多少次?(目前这一条关系不是特别大,便于理解,我还是罗列在这里)
- 这些关键字显示在标题中、网址中还是直接相邻?
- 此网页是否包含这些关键字的同义词?
- 此网页来自于优质网站还是劣质网站,甚至垃圾网站?
- 此网页的PageRank是什么?(关于Page Rank)
等等,通过一系列的计算来总结并归纳你的页面。并且将你的页面放在一个合适的位置(排名),展现在用户面前。
谷歌搜索引擎从开始到现在推出了很多的算法,大家耳熟能详的有如下几个:
1、熊猫算法(Panda Algorithm)
- 时间:2011年2月
- 目标:针对网站内容改进的一个算法
打击对象:重复内容、关键词堆砌、短空内容、用户/程序生成的低质量页面。
改进方案:其实就是提高内容质量度,并且提高有效页面比例。
很多情况,并不是因为你的内容不过关,而是网站结构没有优化,网站程序产生了大量的低质量页面。
如果你觉得你得网站当中包含很多无效页面,建议你做个全站扫描,并且好好检测一下你的网站索引率以及有效曝光率。
2、企鹅算法(Penguin Algorithm)
- 时间:2012年4月
- 目标:针对链接的算法
打击对象:使用链接农场、站群、垃圾链接堆砌、付费链接等,获取搜索引擎权重的网站。
改进方法:杜绝使用以上方式进行外链的制作,如果有遇到垃圾链接指向了你的页面,可以使用 Disavow links 功能屏蔽对应的外链。
如果你对于外链不理解,可以借助下方的视频教程:https://wmovc.com/126/
3、蜂鸟算法(Hummingbird Algorithm)
- 时间:2013年8月
- 目标:针对搜索意图的一次算法升级
谷歌对你的页面内容进行分析,即使标题中没有提及的关键词,只要内容相关也可以参与对应的关键词排名。例如同义词,长尾词的处理等。蜂鸟算法当中并没有打击对象,但确实对部分网站的流量有巨大的影响。
改进方案:通过关键词研究,更好的分析用户的搜索意图。同时在内容当中植入LSI关键词,并合理的将网站进行主题的分类。同时你也可以看下放的视频,相信对搜索引擎更好理解你的网站有一定的帮助。
如果你对于英文内容的制作没什么自信,你也可以按照这个教程来完成内容的制作。
4、飞鸽算法(Pigeon Algorithm)
- 时间:2014年6月
- 目标:针对Local SEO
当时网站数据下降,很多站长都叫做 “被鸽了”,指的就是这次算法
这个算法没啥好说的,主要针对Local SEO。也可以称之为地域词汇。在不同的地域即使搜索相同的词汇,也会显示不一样的结果。当然并不是所有的搜索词汇都会受到这个算法的影响。一些通用词是没有影响的。
如果你希望在特定地域,参与特定关键词排名的话,可以按照如下的方法来推进地域的SEO优化。
- 域名选择对应的地域(比如: .tw 就是台湾、.cn 就是中国 等)
- 使用对应语言的二级域名(比如:德语 de.xx.com、日语 jp.xx.com 等)
- 使用对应地域的服务器(现在很多网站使用CDN加速,如果你也用了CDN,这条就可以忽略)
- 内容中包含地域,以及地域的特定城市词、街道词等。
- 在谷歌地图中加入的本地商铺信息,同时将谷歌地图加入到你的网站中。
PS:对于大多数做外贸的同胞,基本这些可以忽略。就我的学员统计来说,目前900多个学员中,针对地域进行推广的也就十来个。
5、移动算法(Mobile Update)
- 时间:2015年4月
- 目标:针对移动端用户体验
移动升级是针对移动端用户体验的一次算法升级。你需要通过Google Search Console的数据来更改你页面上移动展示的各类问题。经常出现的有如下几类:
- 文字大小,无法阅读。解决方案:将文字的大小(font-size)控制在14像素以上(个人推荐16像素)。
- 可点击元素之间的距离太近。解决方案:将行高控制在26像素以上,并配合边缘属性(Margin)和填充属性(Padding)进行调整。
- 未设置视口值。解决方案:视觉大框架宽度(width)设置为100%,不要使用像素来限定宽度。
- 内容宽度超过了屏幕显示范围。解决方案:一般导致这些问题的是图片,图片限定了宽度,导致了图片会超出选定范围。所以图片宽度(width)设置为100%即可。
如果上方这些你看不懂,那你可能需要一个前端工程师帮助你解决这个问题。
同时,为了满足这个算法,你可能还得解决最棘手的问题——手机端速度问题。当然,如果你使用的是WP建站,那么恭喜你。你通过下方的这三个教程来进行速度的提升。
- WORDPRESS 图片优化+压缩工具
- 减少HTTP请求-压缩JS和CSS-网站加速插件
- WP提速-禁止谷歌字体-DISABLE GOOGLE FONTS
如果你想检测一下自己的网站速度,那么你可以通过谷歌官方的 Pagespeed Insights 功能进行移动端测速。
6、Rank Brain
- 时间:2015年10月
- 目标:用户行为
Rank Brain 没有对应的中文,可以理解为算法的升级。
其实Rank Brain属于蜂鸟算法其中的一部分。我把这部分脱离出来说,目的是为了阐明一个道理——用户的行为会影响你的网站排名。比如说:网站点击率(CRT,Click through Rate)、跳出率(Bounce Rate)、交互时间(Dwell Time)。
一般意义上,一个页面的点击率越高,说明这个页面的品牌效应越好,或者是用户更加青睐。跳出率低代表内容符合用户搜索意图。同时,交互时间越长,代表内容的可读性,垂直度更高。
这些统称为——用户行为。目前谷歌并没有说明这块占整体权重的多少,我们页无法衡量。但是,不断优化这些数据,其实是在提高用户体验,自然没有坏处。
7、负鼠算法(Possum update)
- 时间:2016年12月
负鼠算法和鸽子算法很像,看上方的飞鸽算法即可。只是对地域性搜索做了一个更深入的调整。
8、Fred(Fred Update)
- 时间:2017年3月
这次,我就不把它称之为算法。算是一个小更新。主要打击广告严重,分销信息比较严重的网站。就我看到的数据而言,似乎影响不是特别明显,所以就不做过多阐述。
9、速度更新(Page Speed Update)
- 时间:2018年6月
这块大家可以参考上方的移动端算法,我也提供了WP站点的加速教程。
如果你对自己网站的速度没什么信心,用谷歌官方的工具去测一测。建议无论是移动端还是PC端访问,最起码要达到快速(Fast),就像下方这样。
10、Medic Update
- 时间:2018年8月
本次谷歌没有给出准确的名称。介于医疗类Niche站点影响比较大,暂且称为 Medic Update
正如我所说,谷歌并没有命名本次算法。只是说8月做了一次 核心算法更新(Core Update)
本次更新影响最大是健康类,医疗类的网站。至于改进方案其实也就老一套——做好你的内容。给用户提供更多有价值的信息,而不是一味的卖产品,放广告。
对本次算法更新感兴趣?你可以阅读下 Search Engine Land对本次更新的报导。
以上罗列的是谷歌搜索引擎比较核心的几次更新。我们可以看到几乎每一年谷歌算法都会有一些核心的变化。这些变会导致10-20%的网站的流量受到影响。
除此之外,谷歌几乎每周都会做数据的更新,有点类似更新数据库。所以,通常你会发现你的曝光以及点击是阶梯式增长的。
总结
对于谷歌SEO工作者来说,不需要把优化局限于SEO上,更多的是思考如何提升用户体验。例如:我放什么样的关键可以吸引用户?或者是我的内容如何排版可以让用户停留在我的页面上?等等。
最不需要出现的就是为了SEO而SEO。也许现在某些操作(PBN外链、Click Control之类)依然可以提升数据,但是随着谷歌算法的升级,这类做法也会失去原有的效果。
本着用户体验至上的原则,相信没有任何一个算法会惩罚你的网站。真正意义上做到网站 “常青”。