那么第5课我们今天要讲的内容是关于网站的一个布局及整个网站的seo诊断。那么这一课我们会讲到很多的知识点,那么这里面的知识点都不难,比较容易理解,但是但是都是很多细节问题,可能我们在没有经过系统的CEO培训之前,去看很多 Seo前辈们这些大师们写的一些文章。
那么多多少少可能会有一些了解,但是不全面,甚至有些方面的问题没有去有一个了解,没有一个了解。那么这里我就给大家比较详细的去讲。
好,我们来看到这个PPT屏幕,大家能够看见老师的屏幕吗?好,这里我是用屏幕的分享的方式去给大家讲,便于后面我们直接在网页里面进行操作的时候,大家都可以看得见,这样更直观一点。好的,首先我们来看到第一个问题,第一个HTTP协议及常用返回值, HTTP协议是什么?Http协议即超文本传输协议,这是百度给出的一个答案。
那么它是由万维网和互联网工作小组共同研发的一个协议,相当于就是说我们租房子有一个租房协议对吧?我们在这个公司上班,那么会有一个劳动合同协议对不对?都会有一个协议,那么这是互联网传输文本的一个协议,对吧?我们要遵循协议。
所以就是说这里面的协议是每一个网站都必须遵循的。所以所有的网站我们会发现,不管怎么样,它前面都会加HTTP, HTTP。那么有一种现象,比如说京东这个网站,它是https看到了吗?然后这里加了一把锁,对不对?加了一把锁,那么这个是比较安全的一种方法,一种协议方法。
好,我们回来之前我们也有发一篇文章给大家看了一下,对不对?有一篇文章就是讲到的,我又发到这里面的有一篇文章是讲到这个问题的,这篇百度新访 Http是什么?那么会不会影响排名,这里面已经给出明确答案,是不会影响排名的。而且百度现在放开了,并且它比较认可htbs认为这样子的一个协议它更安全,更加安全,不但不会影响排名,可能还会对排名有利。
好这样的一个情况。
那么这里面我们再来理解一下,通俗的理解即用户或者蜘蛛爬虫请求服务器页面数据时返回的一个状态值。好,这里面我们把它通俗理解,这个理解为我们要的东西,好,这里面是官方的一些说法,我们不用管它,也不用理解太深,那么我们要理解的是什么呢?他这个协议蜘蛛或者用户去请求服务器的页面,也就是说再说简单一点,就是访问网站的时候,返回的一种状态值,告诉我们这里面是一个什么状态,反馈不同的状态。
那么反复的什么状态,什么值表示什么意思呢?我们这边看一下,返回的是40200,那么证明是返回成功。没问题,顺利返回的是404,那么证明这个页面是错误,页面请求失败。如果返回的是301,那表示这个页面有跳转,反过来是503,表示这个服务器有问题。
好,我们来看一下这么一个查询工具。大家可以去输入自己去查询一下网址,大家这个记住站长工具在里面的一个网址就是HTTP协议,然后我们查询一下这里面告诉大家去做一个诊断。
首先我们把你经手的网站,经手的网站,不管是你自己做的,还是说你刚接手来优化的,首先把它输入这个网址,看有没有一个301的跳转,比如说菜鸟后院的网站看到了吗?
它有个301的一个跳转,301的校准,为什么要做301的跳转?是为了集中权重,后面我们会去讲为什么要做这个东西,然后我们一般建议是做301跳转,相应要求的,当然也有一种情况是什么呢?有的是把三w点这个网站跳转到不带三w这个网站对吧?那么我们这个是什么看到吗?我们这个是不带三w跳转到带三w对不对?Location。看到了吗?我们是跳到当然有些是会把跳转到这个对不对?至于为什么要这样做呢?一个是集中权重,后面我们会讲我们会确定首选域的问题。
Ok我们再来看到我们这边下面要讲的一个叫首选域的问题。好,我们先关闭。在讲之前我们再多说一点,这里面的协议我们访问这个网址,然后这里面会有很多这样的一个协议,有这样的一个返回值。200表示成功,201表示创建,202已接受对吧?这里面有很多,但是我们如果说不去做技术,好像这些东西跟我们没有太多的关系,我们只要记住简单的一些301,我们也可以记录一下,这是临时的一个跳转。
然后这里面还有404,400对吧?有很多大家可以去去一一看一下,如果说以后网站碰到了打不开无法访问,或者就是说分析日志的时候出现一些问题,那么我们来这里面去查询一下你的网站状态,我们可以快速的找到问题,问题点到底在哪里,对吧?好,我们再往下看。
第二个,logo制的一个协议, Logo制的一个协议,robots协议是什么意思呢?首先logo纸协议也从也称为爬虫协议,即约束蜘蛛行为的一个规则。任何一个东西都有一个协议规则,对不对?那么这里面就像一个法律一样,我约束你干什么事情,那么由于蜘蛛它是会在全网去抓取任何对他来说有用的数据,对不对?
但是我们可以有些隐蔽性的东西,隐私的,或者是有些比较有用的资料,我们不想公开的对不对?那么这里我们不希望他去抓去,所以就说我们要约束他,约束他,那么如何去约束他呢?我们要创建一个logo的文件,文件,然后上传到网站的根目录,就像这样子。
三w点51-0斜杠low,不是点tst这样子的一个东西。那么他做出来是一个这样的东西,就是一个tst的文档发到网页上面,呈现的形式是这样子的,打开是这样的一个情况。好,我这边在桌面上有一个有一个。我们来看一下,这有个logo子协议对吧?那么正面logo者的协议当中就会去明确规定,明确规定你应该抓什么,不应该抓什么。好,这里面大概是这样的东西,如果说我们发现自己优化的网站没有做一个logo协议,建议大家去做一个做一个然后把它上传到网站的根目录,至于什么是根目录,大家应该清楚在网站最外边那一层。
最外面的一层。如果说你是做程序的,那么你肯定就清楚,如果你不是做程序的,你可以去了解一下,或者告诉程序员放到根目录,ok这是 logo制的一个协议。
好,我们再往下看, logo的正确写法。那么我们刚才讲了,我们必须要做一个logo协议,那么 Logo协议是为了约束蜘蛛,那如何去约束?根据自己的具体情况去约束。首先我们来看到它的基本写法,第一个是禁止任何人搜索任何人,任何搜索引擎不是任何人打错了,禁止任何搜索引擎抓取。
好,我们来看到这个首先这个叫什么?User对吧?User就是用户,用户。那么这里面连到一起其实就是代表蜘蛛的意思。 Again,那么这边一个新号,星号代表什么?代表所有,那么也就意味着这个意思是什么?所有的搜索引擎,蜘蛛程序,明白吗?所有的搜索引擎程序。好,再往下看,alone是允许design,loan是不允许,对不对?所有的搜索引擎不允许什么?这就是一个斜杠。斜杠是什么?斜杠代表根目录,这个根目录以下所有的内容都不允许抓取,看到了吗?
明白这意思吗?不允许抓取。那么老师之前在帮别人诊断网站的时候,有发现一个客户的网站,不知道是他们的程序员不懂,还是有人恶意的。
他放了一个logo子文件当中,就写了一个这样子的罗布兹协议在里面,禁止任何所有权抓取,然后当我拿他的网站的时候就觉得很奇怪,他的网站没有被收录,只有首页被收录,其他页面都没有被收录。
后来我们把我们诊断的时候发现了这样的一个问题,把开放之后只过了短短的一个星期,收入就开始慢慢的上来,然后过了不久排名就慢慢的上来了。这是一个很大的问题,大家一定要看清楚,一定要看清楚。这是禁止任何搜索引擎去抓取,就是说不允许抓取。
好,再往下看,这叫允许百度抓取。好,同样还是搜索引擎对不对?同样代表搜索引擎,它这里不是星号,星号就是所有的对不对?而它这里是百度spider对不对?就是百度蜘蛛,对吧?百度蜘蛛,但是我们再往下看这个叫什么?叫做允许alone。不是。不是上面这个distance是允许对不对?上面是搜索引擎的意思,百度spider,百度蜘蛛怎么样?允许抓取根目录下面所有的内容,明白吗?允许百度蜘蛛抓取所有的也就意味着其他的搜索引擎不允许,对不对?
再往下看,允许任何搜索引擎抓取任何页面,看到了吗?正面同样是同样代表的是什么?搜索引擎这边有个信号,所有的搜索引擎三第三弄什么?空的没有不允许什么?没有不允许的空的对不对?也就意味着双重否定等于肯定对不对?没有不允许的,也就是所有人都允许,也就意味着允许所有的搜索引擎抓取任何页面,明白吗?这就是完全开放的一种模式。
好,我们来看一下我们这张图,我们这张图我们之前的我们之前的这张看到吗?这边就是允许什么?不允许什么,不允许this unknown不允许抓取at面的内容。不允许 fire up down a A load。这个就是说图片的对吧?Image也是图片,这是两个图片,都不允许。
我们再来看到这里 Logo值的一个正确的一个写法,正确写法。好,这个概念大家能理解吗?同学们这个概念能理解吗?如果说不理解的话,可以去百度里面搜索一下low布置的官方写法,在百度里面有对外公布一个官方写法,大家去看一下,千万别写错了的话,有可能蜘蛛不抓取了。咱们在做网站布局的时候也把它放上去,如果说布局好了,或者就是说你接手了一个网站,那么进行诊断的时候一定要把它整出来,千万不要出现这样的一个问题,这是一个很低级的错误。
好我们再往下看网站日志。好,王教授是这里面讲到一个网站日志,刚才我们讲了什么?我讲到了协议对吧?返回状态值,对不对?用户返回的,还是蜘蛛程序返回的,对吧?那么既然会有这样的一个协议,那么蜘蛛在抓取页面的时候,它会有一个状态反馈出来,它每一天都会去抓取页面,那么每天都会有返回的状态,那么就会有很多的记录留下来,就像一个人到了一个地方,它会留下脚印,这就是它的足迹和痕迹,对不对?
好,我们来理解一下这个概念,网站日志暨搜索引擎访问网站留下的记录痕迹,一般在网站出现异常时可以翻看日志记录。
那么由于网站日志内容比较多,所以我们一般情况之下不会去翻它,除非出了一些情况,或者说我们定期去看,比如说一个星期或者两个星期去看一次,或者出现问题的时候,我们去诊断,去排查的时候,我们可以通过网站日志去排查一下,到底是什么原因导致的。这个网站不收录对吧?
当我们去访问日志的时候,如果说我们发现我们的日志记录里面全部都是404对不对?那么就证明我们的页面出现了问题,会出现的错误页面,如果说我们反复的是503,那么证明我们有一段时间我们的服务器出现的问题,导致蜘蛛不抓取对不对?对百度的友好性就比较差,这样的一个情况。
好,那么网站日志每个网站它都会有一个网站日志,那么网站日志的表现形式一般都是在根目录看到了吗?这就是一个根目录,在根目录下面有个叫做三w long啊这样子的一个文件,一般都是这样的一个文件,好,然后这里面是一个文件夹,里面会有很多它会记录,一般情况下会记录一个星期以内的,当然你要更长时间,一个月的也有,对不对?
主要看服务商,主要看这个服务器的一个服务商,他那边是怎么样提供的。当然这里面如果说你如果没有的话,可以找空间服务方索取,让它打包到FTP里面,一般在根目录里面大概是这样的一种情况。
那么这个打开每一天都会有一个网站日志,比如说这一天的网站日志就是这样子的,每天都不一样,里面都不一样,这里面我把菜鸟后院的一个网站日志给大家打开来看一下。
好,这里面有很多还没有出来,其实这里面很多东西可能没有显示的完全又卡了,看到了吗?由于网站日志它留下的数据比较多,所以打开的时候也会比较卡。我刚才在电脑上自己试图打开的时候,都会发现这里面的速度打开速度特别慢,为什么?
因为它这里面的数据特别多,但是这里面我给大家介绍一下,这里面2017 5月27号对吧点login对不对?那么我们就会发现这里面是2017年5月27号的一个日志,然后我们可以看一下,简单看一下这边你看2017年5月26号对吧?一点过2分27秒,对不对?Get。什么get是这个页面看到了吗?这一堆?然后返回的值,看看清楚是200对不对?是200一个状态。然后谷歌机器人对不对?谷歌这个页面对吧?我们去找200对不对?
我们有没有找400对不对?如果说我们发现整个页面当中全部都是400,那么证明我们这个网站 by two发现都是错误页面对不对?那么他有可能下次就不来了,或者就是说这里面的蜘蛛记录很少,那么这名蜘蛛不愿意抓取我们的页面对不对?但是我们可以看到抓取的频次还是很高的,对吧?然后这有个404看到了吗?那么证明老师这个网站也出现了一些情况,出现了一个404,那么证明这个页面可能被删除了。
这是一个百度的图片,image点baidu.com对不对?好,这里面日志到底代表什么意思?这里面先给大家讲简单的去介绍一下,后面我们会有一个专门去分析日志的一个工具去详细的给大家讲这到底是一个怎么回事。好,这里面我们先理解到这个层次。好,我们再往下看第4个概念。
第4个概念叫做首选域,首选域是什么呢?大家来理解一下,首选域及网站的主域名,首先确定的域名叫首选域。好,那么一般的情况之下的话,我们每一个网站,比如说菜鸟后院网站,一般情况之下只会有一个域名对不对?就是三w点CM backyard.com这个域名对不对?然后当然我们这个域名既有三w这样子一个域名或者不带三w这样的一个域名,对不对?这样的域名,这两个域名我们是会同时解析到同一个网站对不对?
我相信大家都是这样做的。
当我们输入这个域名的时候,我们可以访问到我们菜鸟豪源的网站,输入带三w的也能访问到我们的网站,对不对?但是我们要确认一个首选域,是这个不带三w灯还是带三w灯对不对?那么我这边是把它把三w当做菜鸟会员的网站首选于,那么这个就不是首选于明白吗?所以就是说回到我们之前讲的,我们要做一个跳转,就是把这个不是首选域的域名跳转到首选遇难,明白吗?做一个这样的跳转。
那么至于301跳转怎么做,一个是你可以问程序员,第二个可以问服务器服务商它可以帮你做,那么老师的网站就是由服务商去做的,它有一个这样的功能,可以直接做一个301的跳转,这个很简单就可以完成。页面有点卡顿。好,那么我们为什么要确定首选一呢?为什么要确定授权呢?首先因为有很多时候一个网站可能会同时有好几个域名解析,举个简单例子,比如说三w点,不是三w点,有三w点或者没有三w点,w点都一样的,比如说小米.com,米.com,这两个域名我们来看一下,它输入的是它跳转的是同样一个域名,比如说小米.com,对吧?
好,我们会发现它自然而然的跳转到三w点米.com,它会自动跳转到这里,它也做了一个301的定向,对不对?但我们输入这个域名和这个域名的时候,它其实反过来是同样一个域,一个网站对不对?同样是一个网站,对吧?包括京东,京东JD.com,它之前是360by对不对?他之前是不是360b uy半,对不对?它之前是这样的一个域名,好,你会发现它还是会自动跳转到这个域名来,他做了一个301的跳转,它为了集中权重,也是为了集中权重,当然也是为了用户不用去看其他的域名,但有些用户他他可能还会记得原始的域名对不对?
那么这个时候我们就问题来了,那么小米.com可以访问到这个网站,米.com也能访问到,百度就搞不清楚了,哪个域名才是你需要获得排名的域名,对不对?
那么这个时候我们就要确定一下,哪一个是我们的首选域,那么很显然现在的首选也是米.com,他们以前可能是小米.com对不对?现在就变成米.com,那么搜寻语就变成这个了。明白吗?授权就变成这个了。我们就一定要记住米.com才是我们的授权语。好,确定首选一有什么作用,我们再接下来往下看。我们要设置这个绝对地址,绝对地址。
为什么要设置绝对地址?第一防止恶意倾向,第二为了集中权重。我们说二第二个功能就是为了集中权重,集中权重对不对?我们之前说了有小米.com和米.com,我们把它全部都集中到米.com来,对不对?就是不要让小米.com分掉米.com网站的一个权重对不对?就分散了,那么它就权重不集中,对不对?我们全部都集中到米.com域名来,所以我们要做一个绝对地址,做一个绝对地址。
还有一个就是为了防止恶意倾向,防止a迹象。举个简单例子,如果说我们的域名解析或者域名绑定,这两个东西被攻击了,那么有可能有些网站它会恶意的进项就是解析到我们的网站,比如说他把一个黄色网站或者一个违法的网站解析到咱们的网站里面来对吧?
那么这样子的话搜索引擎就会沿着这个路径判断下来,你这个网站本身是存在问题的,对不对?那么你原先的域名也会被开掉,对不对?那么如果说我们做了绝对地址的话,做绝对地址的话,那么我们有一个确定的首选意义。其他的域名镜像那么不存在告诉他我们是有绝对地址的,对不对?我们是有有自己的首选域的,那么其他的域名解析,那么它是非法的解析,你不用考虑它,不能考虑它。
好,那么什么叫绝对地址呢?那么绝对地址到底是一个什么东西呢?绝对地址是对于相对例子来说的一个概念。好,我们来看一下什么叫绝对例子。我们来看一下这个网址是我刚才随便搜的,我刚才随便搜了一个网站就发现它绝对地址就没有做。
好,我们来首先看到这个网站,我在网上搜索的一个网站,我们发现他没有做绝对例子,我们来看一下如何查看它是否做了绝对地址,我们在诊断网站的时候应该这样去诊断。
首先我们查看源代码,好,右击屏幕任何一个地方,空白处不要针对图片,然后右击查看源代码,那么就会有一个这样的页面出来。好,那么我们来看一下它这里面会有很多链接对不对?你像比如说有首页,关于对吧?资讯加盟,好,我们来看一下这些链接。好,首页关于资讯加盟对不对?
好,我们会发现这里面首页是 half。Have now一个杠。对不对?就回到首页,那么这个是about关于它前面有网址吗?没有网址,但是你点看一下。怎么样?这是一个相对低值,但是它会自动给它加上一个域名,对不对?自动加上这样的一个网址,对不对?好,我们来再来试一试。我们再换一个。我们换一个。设备耗材还点一下。好,我们发现什么问题?这里面又自动的加上了一个这样的域名,对不对?我们实际上是有的吗?没有对不对?
所以说这是一个相对地址,但是它会自动的跳转,但是它这里面只是相对地址,没有绝对地址。好,我们再来看到把这个关掉。他一直在谈窗口出来。好,我们来再看我们菜鸟的网站,我们打开。好,打开。我们往下拉,往下拉,继续。
好,我们来看一下餐饮后院这个网站当中有一些栏目运营seo建站,对不对?好,我们来看一下运营前面是不是加了三w点 CM back yard.com对不对?这里面也加了,对都加了对不对?都加了。是不是都这样?我们点进去看一下,比如说我们点一下路上我们的一个职场这样的一个栏目你会发现对不对?他本身也有的,他没有说给它加上一个就是说它本身就有对不对?这个是一模一样的。
好了,那么我们就要开始解释什么叫做相对路径,什么叫绝对地址了,这个就是相对路径相对地址,那么我们这就是一个绝对地址,我们已经确定了我们的手续,并且我们很肯定的告诉你,这就是我们唯一的一个地址,没有其他地址。
它们这边是这样子的一个域名对不对?那么如果说它有其他域名去解析,那么它这个里面可能会变,就不是这个了,对不对?这就是相对地址和绝对地址的一个问题,那么这样子的作用是什么?刚才我们已经讲过了,好,一个是防止恶意进项,比如说刚才没有做绝对地址的网站,如果说他被一个黄色网站或者一个非法网站给镜像了去解析了,那么就有可能会被网站网站就可能会被k对不对?
还有1个就是说它的权重不集中,如果说它同时有2个3个4个域名去解析到这个网站的话,那么搜索引擎就不能判断哪个域名是你的首选一名,哪个域名是你需要优化的域名,对不对?那么这个时候你的权重得不到集中,你的排名就得不到提升。
好,那么同学们后期如果说在后期在确定网站需要优化,然后诊断的时候一定要注意这个问题,这些都是细节,但是细节可能真的决定成败。好,这个是绝对地址。Ok,我们再讲最后一个概念,我们上半节就休息一下。我们讲6第6个叫做URL,标准化,126大家就都知道不用解释了, Url就是我们的网址链接,那么URL标准化是一个专有名词,当然我们也可以把它理解为统一化,ur的统一化或者网址统一化。
好,首先我们来看一下,好,我们来看一下,我们的差检花园的首选一是什么?三w点CM贝卡亚的.com,对不对?那么这是我们的首选玉,对不对?我们的首选语,那么请问好,这里给大家提问,请问站内站外锚文本链接应该放哪个?
地址,我们在做外链的时候在做毛本外链的时候,还有包括我们在做站内的内链的时候之前有讲过,我们要增加一个网站的权重,必须做外链,并且是毛本的外链,并且在站内有文章当中出现该关键词的时候要加一个锚文本对吧?锚文本是什么?锚文本就是一个关键词加上一个链接,那么当我们出现了当我们出现了毛本链接的时候,我们应该放哪个链接?这里面有给出5个答案,abcde那么同学们考你们,我们应该放哪一个?我们应该放哪一个?
好,大家请把答案写在对话框里面,我们之前有讲了,我们要确定一个首选域,确定首选域之后,首选育就是我们统一的唯一的一个标准。有二楼标准,我们以后就以它为中心去做外链去做内链。好,那么这里面我们给出5个答案。有说b有说c我们来看一下。
首先首先第一点,首先第一点,我们的首选意识三w点cnbackyard.com对不对?那么我们之前有讲过我们的首选意识带三w点,那么不带三w的我们就把它排除对不对?你看 a排除,一一排除,那么 bcd对不对?好,我们来看b B这个链接,大家发现什么问题没有?徐少丽同学。那么b链接它没有HTTP协议,看到了吗?没有HTTP冒号斜杠两个对不对?那么他没有这个协议,他没有协议,所以这个是不成立的,其实。
你们发不出去的其实它可能会显示错误,或者有些网站会自动给你加上HTTP协议,没有协议是不行的,之前我没有讲过协议。
好,我们再来看c和d两个答案,我们发现c和d两个答案它的区别在哪里?区别在哪里?一个是。后面没有斜杠看到了吗?一个是后面有斜杠,看到了吗?它的区别在哪里? C和d就在这里。好,那么有斜杠和没有斜杠,我们该用哪一个?我们该用哪一个?好,这里面一个。如果说我们确定不用斜杠,那么以后都不要用斜杠,如果我们确定用斜杠,那么我们以后都用斜杠,明白吗?我们统一一下,这边就是像打仗一样,我们要统一指挥,统一部署,如果说你前期考虑我不想用斜杠,那么后面都不要用斜杠。
如果说你用了斜杠,那么你都要用斜杠,明白吗?如果说我们确定之后,即便是在做友情链接的时候,你在跟别人交换友情链接的时候,一定要跟大家说一下,如果你没有斜杠,那么你就让它不要加斜杠,明白吗?确定这一点,包括我们在做外链,在做外链做内链的时候出现的一个链接的时候,我们都要注意这样的一个问题。好有斜杠我们都有斜杠,没有斜杠我们都不放斜杠,好,这个是 Url标准化的一个概念,ok那么上半段我们就先讲到这里。
好的,谢谢大家。
发表评论