百度搜索引擎对于文本的算法

那么我们上一节课讲到了搜索引擎的原理,对吧?就是排名的过程原理,不知道大家有没有学好对吧?我们今天来学一个更加核心的底层规则,那就是文本算法。文本算法它通俗易懂的理解就是计算文字的算法。对,当然这个系列我们也不会设置的太深入,不用怕听不懂。

我们先来讲一些基础的那么文本算法把通俗易懂来说就是文字算法,那么是吧?可能你觉得他会不会涉及到非常激烈的文字计算?其实我先来举出最简单的一项,因为文本算法的话它只是一个计算文字规则的一个统称而已,是吧?那么它有很多一些细小的这种像举个最简单的,比如说自述,那么字数它在统计一个页面的时候,那么一个很基础很简单的东西,就是字数。

比如说它计算一篇文章的话,它首先会统计它的字数,毫无疑问就是这里面这篇文章的字数到底是怎么样的?

你也发现了各位同学,当你去搜索的时候,如果说文字很少,他几乎是很难获得关键词排名的是吧?

往往排名在前面的都是字数比较多的,或者说一些平台比较权重比较高,所以这是影响长尾词排名两个比较重要的因素是吧? Ok没错,这种可能你觉得老师怎么就这么简单?其实搜索引擎它只是机器而已,它不像人对吧?

我们人的话我们可以有眼有眼睛,有嘴巴,有思考的去阅读文字,但是机器它可以吗?你就问一台电脑它能不能认真的去读,它肯定是读不了的,是不是?所以很大程度它是对吧?用一些基础的计算规则来计算一个页面它的质量,或者说有用他的一些考核的方式来进行考核。所以对吧?那么我们前面对吧?上一节课讲到的分词算法,分层算法的话,它也有很多很深入的运用,页面中的文本的计算,它也离不开分词算法了。

比如说我们点击搜索一个之后点击百度快照,我们就可以看到这里面有顺联挖掘机培训对吧?这里面有标黄色了,看到了没有?看到了吗?对。有标黄色。对,那么也就是说对吧?这么多个文字,它同样也是采用分词技术来进行计算的,对吧?好疑问。他就这么来的。

所以一个网页中出现了哪些字,它确实尤为的重要。对,可想而知了。当你的网站如果里面它根本就没有出现挖掘机或者说培训,你觉得挖掘机培训它能够排在前面吗?肯定是不可以的,对不对?所以对吧?文字检索搜索引擎最原始的一个检索的方式,所以说我们需要在页面上布置我们的这些词,它才有更高的得分,所以在搜索引擎那里也叫做相关度的计算。

好,相关度那么相关度简单来理解,就是睡眠挖掘机培训了和页面它的相关程度是吧?到底是多少?其实说白了,这个字对吧?这些字和网页上面的这些字有多相关,他从哪里看得出来是相关的?对吧?

第一个,它出现的这些词语是不是?对,第二个,这里面的词语和它的相关程度,对吧?从而就来进行确定了。你看,所以说文字在页面当中的布局也是非常的重要的,是吧? Ok当然我们现在先点到为止,先不要太过于深入,对吧?因为你一旦扯的话,它就会涉及到很多的东西在里面是吧?我们移不过来,我们先把这些基础的东西把它学好,学扎实,你先对文本的计算有一些很基础的概念,我们后面再学一些更加深入的东西。好了,文本算法的话我们就讲到这里。

好,同学们,我们下节课再见。

本站文章均为原创,版权归倪叶明创业工作室所有,不欢迎任何形式的转载和复制,请自重。

最后编辑于:2022/5/19作者:倪叶明创业工作室

倪叶明创业工作室(微信:543890)专注于网络创业14年,操盘过上百个网络项目,拥有丰富的网络项目运营经验。2016年切入知识付费赛道,深耕8年时间,已赋能超过3万+草根创业者,是集项目实战运营与培训一体化的创业工作室。我们的目标致力于帮助10万名草根成功实现互联网创业,赚取网络第一桶金。