今天我们来讲解下“百度搜索引擎工作原理(详细讲解)!”如果想要做好网站SEO,就必须要了解百度搜索引擎的工作原理,然后我们才可以对应的去操作,对吧!SEO优化操作其实就是根据搜索引擎的原理去顺应操作,百度喜欢什么,我们就提供什么,然后得到百度的认可,给予我们相应的排名,下面我们详细进行讲解“百度引擎的工作原理”!
搜索引擎工作过程非常复杂,我这里只简单介绍搜索引擎是怎样实现网页排名的,并且我只是针对注册类博客的SEO需要了解的知识。本文章介绍的内容相对于真正的搜索引擎技术,来说只是皮毛,不过对博客的SEO已经足够用了。我尽量最容易理解的方式,并且不设计到算法和深奥的理论知识。
搜索引擎的工作过程大体上可以分成三个阶段:爬行和抓取、预处理、返回搜索结果。
爬行和抓取搜索引擎蜘蛛通过跟踪链接访问网页,获得页面HTML代码存入数据库。
搜索引擎蜘蛛是怎样抓取网页的呢?
发现某一个链接 → 下载这一个网页 → 加入到临时库 → 提取网页中的链接 → 在下载网页 → 循环。
首先搜索引擎的蜘蛛需要去发现链接,至于怎么发现就简单了,就是通过链接发现链接。其方式有深度优先和广度优先。当然我们注册的博客基本不考虑网站目录结构的问题。通常网站结构通常分为以下三个层次:首页——频道——文章页。理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理起来,会更简单。
对于博客SEO,要想让蜘蛛抓取我们的文章,就必须为文章导入链接。无论是外部链接还是同一个博客的内部链接,都可以增大蜘蛛发现网页并爬行的概率。否则蜘蛛根本没有机会知道页面的存在。
比如:我写系列博客喜欢把相关文章的连接写在博文里,虽然开始我的文章没有一篇被百度收录。一天,有一篇文章上了http协议分析工具上了博客园-原创精华区,因为其页面权重高,百度蜘蛛抓取也就越频繁。随着这一篇博文的收录,我的所有博文就都被百度收录了。
索引程序对抓取来的页面数据主要进行关键词提取、生成倒排索引、页面PageRank值计算、关键词与页面相关性、TrustRank值计算等处理,以备排名程序调用。这是搜索引擎能在极短时间内返回搜索结果的关键。其中我们最关心的是PR值和相关性。
PageRank原理
了解PageRank也就是理解为什么SEO要求一定数量高质量的外链。
PageRank可以形象的比喻成:一个页面的排名是由链接来"投票"的结果,并且是权重不等的投票,优秀的网站为你投的一票会为你的排名更靠前,垃圾网站就没啥用。因此高质量的外链是对SEO是很有帮助的。
经过页面PageRank值计算之后,网页会得到一个与页面主题(内容)无关的排名。
PageRank值决定因数:(来自维基百科)
PageRank works by counting the number and quality of links to a page to determine a rough estimate of how important the website is. The underlying assumption is that more important websites are likely to receive more links from other websites。
上面这段话的大意是:PR值是通过指向该页面链接的数量和质量来决定。
链接的质量怎么理解?
假设一个网页PR值较高(重要性高),那么出现在该网页内的连接质量就比较好。通常一些权威网站PR值较高。
这也就意味着网页之间的重要性会传递。一个链接传递的PR值决定于导入链接所在页面的PR值,发出链接的页面本身PR值越高,所能传递出去的PR也越高。
关键词与页面的相关性
了解相关键词与页面的相关性就是要理解为什么SEO要求做好文章的锚文本以及关键字优化。
影响页面与搜索关键词相关性的因素有链接分析、词频及密度、关键词位置及形式、关键词距离等因素,其中链接分析占了相当大的比重。
不得不提的是百度创始人李彦宏的超链分析专利。
建立一个链接词库,记录链接锚文字的一些相关信息,如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接总数,包含特定关键词的链接都指向哪些页面。词库不仅包含关键词原型,也包含同一个词干的其他衍生关键词。
根据这些链接数据,尤其是锚文字,计算出基于链接的网页的相关性。在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合使用,得到更准确的排名。
页面有越多以搜索词为锚文字的导入链接(这句话得仔细体会),说明页面的相关性越强。链接分析还包括了链接源页面本身的主题、锚文字周围的文字等,比如一个服装类的网站有指向java语言学习页面的连接,那么这个页面和搜索关键词的相关性就低。
返回搜索结果用户输入关键词后,排名程序调用索引库数据,匹配关键词,然后按一定格式生搜索结果页面。这是因为前面的预处理,搜索引擎能在极短时间内返回结果。
百度搜索结果显示格式
自然结果格式解析
百度自然界结果的一条记录格式如下:
第一行是页面标题,通常取自页面HTML代码中的标题标签(Title Tag)。这是结果列表中最醒目的部分,用户点击标题就可以访问对应的网页。所以页面标题标签的写法,无论对排名还是点击率都有重要意义。
第二、三行是页面说明。页面说明有的时候取自页面HTML中的说明标签(DescriptionTag),有的时候是从页面可见文字中动态抓取相关内容。所以显示什么页面说明文字是用户查询时才决定的。
第四行是百度快照和百度口碑的好评率,注意这个好评率是整个网站的好评率,而不是单个网页。
好了,通过以上的讲解,我想大家已经大概的了解了百度搜索引擎的工作原理,简单的说,我们发布了内容,百度会通过一系列的判断步骤,来判断我们的文章是不是精品的,符合用户需求的,如果符合,那么百度就会优先收录,给予一个优质的排名,其实很简单,好了,今天就讲解到这里,希望可以帮助到大家。
猜你喜欢
点击排行
联络方式:
电话:173 1266 2225
邮箱:network@z03.net
-
鹅蛋怎么保存 鹅蛋保存的要领
1、可以保存在温度为1℃-2℃的冷库内,在这样的温度下,蛋内的微生物和酶的活动受到抑制,从而达到保鲜的目的。2、或者找个容器,在容器中添加填充物,如谷糠、锯末、谷物、豆类、植物灰等,进行鹅蛋的贮藏即可。鹅蛋怎样保存 鹅蛋保存的技巧...
-
十二个月如何分季节 十二个月怎么分季节
1、十二个月怎么分季节,春季为3-5月、夏季为6-8月、秋季为9-11月、冬季为12-2月。2、在气候上,四个季节是以温度来区分的。在北半球,一般来说每年的3~5月为春季,6~8月为夏季,9~11月为秋季,12~2月为冬季。在南半球,各个季节的时间刚好与北半球相反。南半球是夏季时,北半球正是冬季;南半球是冬季时。十二个月怎么分季节 十二个月如何分季节...
-
怎么做腊鱼 腊鱼的做法
1、主料:肉若干、鱼若干。辅料:盐适量、花椒适量。2、按照一斤鱼三两盐的原则,放盐、花椒入锅炒热 以便更加容易渗透吸收。3、用10斤以上的草鱼、鲩鱼都可以。鱼大肉质厚,剖开以前先洗干净外部,用鱼的血抹遍鱼身体内部,这样腌制出来的鱼肉就是红的。4、把炒好的盐均匀的抹遍鱼身体全部,鱼头的缝隙特别要抹盐,以免容易变质。把准备好的盐全部抹完,主要是里面,外面有鱼鳞不容易渗透就抹少一点。5、全部抹完就把鱼放...
-
玉中带紫罗兰
“玉中带紫罗兰”是形容玉石中带有紫罗兰色的意思。玉是一种珍贵的矿石,多种颜色都是珍贵的,其中紫罗兰色更是稀有而美丽的颜色。所以“玉中带紫罗兰”常被用来形容物品的珍贵和美丽,也可以用来形容人的优秀和出众。这个成语的意义是告诫人们要珍惜身边的珍贵事物,不要轻易错过或忽视它们的存在。同时也提醒人们要对自己拥有的优点和才华充满自信,不要忽视自己的价值。总而言之,“玉中带紫罗兰”是形容珍贵和美丽的东西,也是...
-
表达心情忧愁的句子 表达无奈的忧愁的句子
1、时间会淡化一个人的记忆,却永远无法让人淡忘那些回忆。2、你施舍的寂寞,让我比一无所有更难过。3、不是我说你的眼光可真是俗这么好的在这你不要你偏挑便宜的。4、没有什么事昰值得感叹旳,值得感叹旳事根本不会需要感叹。5、我不贪心。只有一个小小的愿望:生命中永远有你。6、实在我们都怕痛,实在我们笑的都很做作。7、谁都不许伤害我姐妹。没我的允许,谁都别想动我姐妹。8、离开你再也不会爱了,所有的伤心都给了...