SEO之路上难免会遇到一些雷人的事情,比如网站改版了还收录旧的URL地址、测试网址无缘无故就被收录了造成即将网址不被收录、换了IP结果造成百度收录不更新了等等,大多数的时侯你们都把问题的诱因归结于百度,百度实在有些冤枉,中国服装网seo负责人飞鹰正义在工程师的赐教下为你们揭露这奥秘。
在开始前先简单的给你们讲解一点小知识:
域名和IP相当于站点的名子和身份证,IP相当于现如今的身份证,但是身份证IP地址很难记,所以就形成了域名。这里不是给你们普及历史知识,只是现今大多数情况下都采用域名来访问所以引起你们忽视了一个事实:最终轮询的是身份证号码也就是IP,不是域名!来看个域名解析的简化过程图
通过这儿你们应当明白一些了吧?域名只是便捷我们记忆,而真正的轮询的应当是IP!大家都晓得域名DNS服务器在全球有N个节点,我们新域名刚解析的时侯常会见到个别区域由于DNS数据同步慢而造成访问不了的情况,而老域名换IP的时侯也会遇到用户访问的还是老IP的想像。这你都晓得?别急你还有不知道的!
然而我们的搜索引擎蜘蛛大多数分布式抓取,自身都建有DNS,一来解决抓取的时侯的效率,不必每次都要解析IP后抓取,二来我们站点的主体表现形式都是域名,而不是IP,所以带着我们的域名host头去访问我们的老IP还是会访问的到,因此才会造成我们开头提及的一些雷人怪象。说完基本概念,我们再来详尽剖析一下这几个怪象的具体动因!
一、网站改版了还收录旧的URL地址
这个问题似乎跟前面的基础没啥太大关系,但每晚在百度站长社区问的人实在是太多了,也算是收录的一大雷人现象,所以在这儿还是拿出来叨一下。
很多站长网站改版了启用了新的URL结构,也在站长平台进行了改版递交,但是还是出现收录旧的URL,遇到这个问题首先我们还是从站点自身的问题找起:
1.是否早已清除所有旧地址入口?
这是个严肃的问题,很多同学由于站点大、结构复杂、改版不彻底造成并没有清除所有入口页面,导致新内容形成的同时在一些角落里还是形成了老的入口,只要链接地址还是老的就有可能被收录。所以要改版要换URL必须彻头彻尾的把所有链接替换为新的URL。为了加速生效新的链接不仅站点自身链接外尽可能更改一下外部的链接,例如友情链接。
2.老的URL是否做了301到新的URL上?
老的URL是否真的是301到新的URL里面?我也碰到一些雷人的同学使用js之类的技术,看起来似乎也是跳转,也像这么回事,但似乎根本不是一回事!
3. 关于百度方面
在做好1和2的基础上,即使百度收录了旧的链接,也毋须害怕,因为百度对跳转属性的站点和链接辨识和确认须要一定的时间,而且只要是稳定的跳转,最终就会转换成新链接的流量,当然记得通过网站改版工具及时递交改版规则。
二、测试网址无缘无故就被收录了引起了即将网址不被收录
这里我建议你们之后测试的时侯尽量环境保证本地或则在特定测试环境下就能访问,否则现今的各类浏览器可能会把地址透漏出去,也有不留神把地址拿去搜索等渠道造成被搜索引擎收录这么对你的站点上线影响还是蛮大的。
1.没有关掉测试服务器
上面普及知识有提及过,大家换IP或则换URL地址的时侯由于老的服务器没有关掉,而搜索引擎缓存了IP,导致搜索引擎还是可以访问到那些页面;
2.没有删掉IIS绑定
还有一些同事换了IP地址,但是并没有在老的IP上的网页服务器上删掉网站绑定,导致搜索引擎带HOST头访问该IP的时侯才能访问到旧的内容;
一般情况下搜索引擎缓存的时侯较长,或者因cdn等诱因引起IP同步失败的就会造成上述情况发生,更换ip之后,可以通过抓取确诊工具测试一下百度是否还能正确抓取,如果解析到的ip有误,可点击抓取确诊详情中的“报错”,通知百度更新您站点的ip。
三、换IP后造成百度不收录
上面提及搜索引擎会缓存IP,百度在换IP的时侯也说过尽量保证老服务器一段时间内可以访问,为什么要这样?因为服务器真的须要时间去同步内容同步IP,而且直接断了老的服务器很容易造成短时间突发404,因此会给站点导致不可预估的问题;
换IP后不收录缘由也是这样,因为换了新服务器数据迁移后引起老服务器的内容并没有更新,所以这个时侯似乎是百度根本抓取不到你的更新。因此须要通过前面的方法早日告诉百度,您站点ip的变动,减少站点流量损失。
结束语:
其实收录雷人问题好多,我列出了大部分可能碰到的一些雷人问题,大部分情况下都是站长存在的一些误区所造成的。