SEO的数据分析I——开头和收录部分

JerryXia 发表于 , 阅读 (1,950)

虽然有些文章很老,但是到现在已经很有指导性作用。我这边也先不借用谁的理论,我们从事实出发,好好回想一些用户是如何通过搜索引擎来到我们网站的?

 • 用户在搜索框中输入一个关键词
 • 用户在搜索结果页面中阅读大量结果
 • 用户点击进入某个它满意的结果

OK,这是最简单的一次用户访问,事实上用户还有一些其他情况,本文先不展开讨论。

我们还是针对每一条用户操作,设定一些问题,然后再对应的问题,我们来找一些数据出来解决这个问题。

我们想知道用户搜索了什么关键词?这个关键词的目的是什么?我们的页面能不能满足用户的这种需要呢?

我们的页面,如何出现在搜索结果页面中?如何在搜索结果页面中脱颖而出,让用户点击你?

如果把这三点做好,我相信一个网站的SEO流量绝对不会低。我们如何开始做?(夜息注:本文没有一步速成的方法,如果想一步登天可以绕道)

就拿第二个问题来看,我们的页面,如何出现在搜索结果中?

这是一个看似很愚蠢的问题,“哈哈,不就是收录的问题吗?”,有人会说,“我的网站早就被百度收录了,但是什么流量也没有”。我们来看看下面这个例子。

这个网站百度收录有7百多万页面,看起来不错,我们到这个网站上去看看。

有一个叫“国际酒店”的频道,上面写有13万酒店预订服务信息。换句话说,我至少有13万个不重复页面,来描述这些酒店信息。百度收录1770,Google收录18200,如果算上一些索引页,那总体收录比率只有1%,甚至更少。(夜息注:inurl的查询方法并不是很准确,所以还有待考证,本文只是做一个例子)

再换言之,如果我在百度,Google上搜索大部分的国际酒店预订信息,这个网站的页面可能不会出来在搜索结果中。因为根本还没被收录。

看到一个10年的数据,说中国10年的时候有5000多万人次出境。如果估算30%人需要订酒店入住,那这就是一个巨大的流量机会了。很显然,这个网站这这块细分蛋糕上还有很大的提升空间。如果作为SEO集中精力解决这个频道的收录问题,相信对网站业务有很明显的提升。

如何解决收录问题,我相信很多人已经很有办法了。我也就不老声长谈了,很多东西都能在上面推荐的文章中找到,就总结一下我自己分析的SEO数据。

 • 某频道爬虫每日抓取量
 • 某频道爬虫每日不重复抓取量
 • 某频道爬虫单页下载时间
 • 某频道网页响应速度
 • 某频道每日爬虫到访次数
 • 某频道Top目录
 • 某频道收录比例抽查
 • 某频道响应代码统计

依靠这些数据,我们很清楚的就能了解到某频道的网站收录情况如何,问题出在哪里。

是压根没爬到?还是爬太少?还是爬不全?还是页面质量太低?还是服务器配置错了?还是服务器Down掉了?一切问题,都逃不出这些数据的法眼。

添加新评论