百度搜索在周二凌晨启动了搜索结果更新,据ce36观察,从凌晨三点开始至早八点,有部分网站数据一直在调整,其中表现最为突出的是收录数的调整,不仅中小网站收录数据有变化,很多大型网站、行业门户的收录数据都出现了相应的调整。仍然有相当一部分的网站在本次数据调整中未受影响,例如一些大型传统行业的网站数据变化不大,收录数保持1000-3000条左右变动。
百度曾经在月初出现过类似的数据调整,部分网站的访问量并未因此类收录数而产生巨大变化,但在第二天,百度即刻恢复了大部分的网站收录数,因此,有站长认为,这是百度在进行新的算法调整,属于技术调整范畴。 很多站长,会使用不带关键词的site语法来进行收录量观察。这是一种方法,但不完全准确。site语法设定的初衷,其实是期望用户可以设定约束搜索范围,实现更加精准的搜索。这同intitle,inurl,本质上是相同的。而在这些高级语法下的结果数,和常规搜索一样,都是“估值”,而非精确值。因此,很有可能site下的“结果数”减少了,实际被索引数却可能增加了。
其实准确的方式就是对来自搜索引擎的流量进行监控。这是最直接和本质的。如果流量没有大的波动,而site下的数值发生巨大波动,这只能说明site搜索结果数的不精确性。对站内url进行抽样监控。有些url已经被搜索引擎收录了,那么取出一个集合,作为收录状态监控集;每天的新url尚未被收录,也可以对其进行索引状态的监控。脚本是很容易写的,这种基于抽样的评估也是很有效的。
如果流量没有大的波动,但实际上新的页面是已经被收录,只是因为排名不好,所以并没有流量过来,这样子的话也不能说site的结果不准?只能说是权重不够高。因为一个新站,前期一定只是一个积累的过程,可能流量并不是那么的重要,但是收录的确还是很重要的。代表的是,你已经进入了百度的索引了。url抽样监控,这样子的一个收录监控方式,我想,对于我们这些个人站长来说,在现阶段来说,在高手眼里的小技术的脚本,可能就是一座难以逾越的大山。而互联网上,因为来说草根站长是占了绝大的一部分。
如果是百度提供类似统计工具,ce36是无上欢迎的。其实site来说,对于站长本身,很大一部分就是让自己心里有了一个底,可以用一个脚本来替换得到更准确的值的确是可行的,而且自己是可以通过流量统计后台来实现成效的检验的。但是有一点可能被您给忽略了,site用的最多的场合不是自用,而是交换友情链接的时候用的。估计很小部分的人会交换一个友情从而去动用脚本去检测索引对方网站的具体数据,这一块,要如何更好地解决呢?用site语法查询之后,如果排在第一的不是该网站的首页则表示该网站被百度降权。这种做法是否想当然?site语法查询的检索结果,更多情况下类似随机的排序,除了说明这些网页已经被收录以外,不能说明任何问题。
最近有很多站都遇到这个情况,刚发布的文章都会很快被百度收录,可过不了多长时间(8到24小时)又会被百度删除,然后再过同样多的时间百度重新收录!ce36觉得这可能是系统的一个缺陷,预计很快就不会有这种让人faint的事情出现了。其实不管百度怎么样调整,站长只要坚持做好更新,相信百度也会给予一些权重分的。
