做过SEO的同学都晓得,网站的一些页面经过很长一段时间都没有被百度收录。究竟为何?接下来,让我们排除一个缘由,为什么这种网页不收录在网站上。
Robots协议:Robots协议将告诉spider不能对页面进行爬网,因此不会对页面进行爬网和收录。
网站地图:网站地图是指网站地图。根据蜘蛛爬行的数学逻辑,蜘蛛一般先爬行网站地图,因此制做好网站地图也极其重要。
百度站长:如果网页没有收录,把网页递交给百度站长,这样不收录的网页也可以收录。
如果排除了上述三个小问题,那么无论网页是否收录在内,我们都须要考虑以下三个问题。
1、 页面内容质量低
页面内容的质量是搜索引擎蜘蛛判定该页面价值的一个重要诱因
如何处理网站中未收录的网页
页面内容收录:一是模板重复;二是文章重复。收藏软件的普及致使网站的构建显得太容易了。各种“抄袭”文章的工具,CMS的收藏和自助建站功能,让好多站长一夜之间创造了上千个网页。此外,征集规则的死板、虚假的原创和网路上的高层次重复内容太多。
百度蜘蛛不累吗?每个人都在选购同样的东西,也许你忽然被百度收录了几,但百度迫使你重新筛选。如果一切都是一样的,百度对你一见钟情。虽然很难原创,但我不建议网站完全搜集大量的东西。我们可以按照文章的中心思想,把自己的东西结合上去,发表一篇称作原创的文章,对其进行适当的搜集和编辑。
2、 页面优化过度
百度对SEO网站的过度处罚越来越严重,会导致百度收录少或不收录。内容是重要的。即使你有一个强悍的外部链,暂时不更新原始内容,百度也不会收录你的文章。过度的优化收录大量的关键字堆积、垃圾外链、错误的HTML编码以及不合理的JS和flash。
3、 蜘蛛抓过它们吗
一个正常的页面只要蜘蛛抓取一次,这个页面就可以收录在内。如果蜘蛛不爬上这一页,它将不收录在内。如何查看蜘蛛是否已爬过此页?我们可以剖析我们的网站日志
这里还提醒一些菜鸟同学喜欢直接删掉不收录的页面,一定不要如此做。