小米技术社区
小米技术社区管理员 关于小米

27岁,山西运城人,职业电商经理人,前端开发工作者,从事过网站建设、网络推广、SEO、SEM、信息流推广、二类电商、网络运维、软件开发,等相关电商工作,经验较为丰富,小米技术社区致力于为广大从事Web前端开发的人员提供一些力所能及的引导和帮助 ...[更多]

E-mail:mzze@163.com

Q Q:32362389

W X:xiaomi168527

小米技术社区大牛王飞 关于王飞

27岁,山西运城人,职业电商经理人,网络工程师兼运维,从事过运营商网络建设,企业网络建设、优化。数据中心网络维护等通过,经验丰富,座右铭:当自己休息的时候,别忘了别人还在奔跑。 ...[更多]

E-mail:wf_live@126.com

Q Q:3940019

微博:王小贱ss

小米技术社区设计小艳 关于小艳

大于花一样的年龄,河南郑州是我家,2010年在北京接触团购网,2011年进入天猫淘宝一待就是四年,如今已经将设计走向国际化(ps:误打误撞开始进入阿里巴巴国际站的设计,嘿嘿)五年电商设计,丰富经验,从事过天猫淘宝阿里各项设计,店铺运营,产品拍摄;我将我的经历与您分享是我的快乐!座右铭:越努力越幸运! ...[更多]

E-mail:97157726@qq.com

Q Q:97157726

标签云
精品推荐
  • 搜索引擎是如何判别文章原创和伪原创的?文章伪原创的方法有哪些?

    搜索引擎是如何判别文章原创和伪原创的?文章伪原创的方法有哪些?

    百度、谷歌、360等搜索引擎如何辨别原创和伪原创的?文章伪原创的方法又有哪些?从1998年世界搜索引擎谷歌的成立,再到2000年国内搜索巨头百度的成立,孕育而生的SEO(搜索引擎优化)技术也走过了近20个年头了,和很多事物一样……
    296人已经看过了
  • SEO中H1标签用法的注意事项

    SEO中H1标签用法的注意事项

    我们做网页的时候经常会出现h1标签,大伙普遍的做法是h1标签用在内容页的标题上,但是需要注意的如果出现在标题上一定要保证h1标签里面title的唯一性,就是不能有别的标签混进去,……
    405人已经看过了
您的位置:首页 > 前端开发 > SEO > 站内优化

什么是网站的收录量和索引量?其区别是什么?

分类: 站内优化101个赞

今天在搜狗站长上看到网站的收录量和索引量后对网站收录量和索引量重新又有了疑问,从搜狗给出的索引量和收录量走势图来看,


搜狗收录量是指:搜狗爬虫对网站所有页面抓取成功的数量,也就是说站点中有多少个页面作为候选结果

搜狗索引量是指:是指被收录的页面经过索引流程后的总网页数量,也就是加入搜索结果的网页数量。


搜狗站长工具收录量和索引量截图


可是之前一直做的百度,认为索引量是被放出的数量,而索引量是被抓取的页面数量,为此专门查了一些资料:


百度官方给出的说法是:什么是百度站点索引量?

站点中有多少页面可以作为搜索候选结果,就是一个网站的索引量。

站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索结果中展现给用户。页面通过系统筛选,并被作为搜索候选结果的过程,即为建立索引。

目前site语法的数值是索引量估算值,比较不准。推荐站长们使用我们的新工具,同时我们也正在努力改进site语法。 


由此可以看到百度的索引量和搜狗的索引量是对立的概念,并且百度明确说明site语法是索引量的估算值,如果想看精确的索引量可以用百度站长工具。


另外又在百度官网帮助上看到这样一段话。


各位站长都知道索引量(或称收录量)是网站流量的基石,每天都会盯着百度站长平台提供的索引量工具查看。理论上说,索引量发生波动属于正常,但也不应掉以轻心。


这里可以看到百度可能将索引量和收录量的关系模糊化了,即可以认为索引量=收录量,收录量=索引量


综上所述,什么是收录量、什么是索引量要根据哪个搜索引擎而定,我们可以根据各大搜索引擎的站长工具平台来看自己网站的收录量和索引量



另附上索引量出现变化的问题排查方式:

blob.png




2016.5.13更新,今天看到了百度官方对【收录量】和【索引量】的官方解释,确实和搜狗的不一样,以下是正文:


收录量=索引量?

索引量就是收录量?

这个问题抛出来

估计会让很多站长蒙圈、傻傻分不清

很长一段时间以来

坊间含含糊糊,将两者混为一谈,

其实

收录量和索引量

这对儿孪生兄弟

有着迥然的意思

其中

暗含着搜索引擎对网页抓取和收录的原理

作为站长

不可不知

噗噗,下面请站长摆好姿势

准备接招儿


一张图,助你秒懂收录和索引

下面详细为你解析



收录和索引分别指什么?


收录:页面被Baiduspider发现、分析过


索引:Baiduspider经初步分析后认为有意义,做建库处理



收录和索引的关系?


包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具是通往收录的大门。


收录和索引的意义



【收录意义1】收录是索引的前提,站点需要保持服务器稳定(参考抓取诊断工具、抓取异常工具)、robots正确(《robots写法和需求用法对应表》),为Baiduspider抓取铺平道路


【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换


【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)


【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中



如何查询收录量和索引量


目前百度未提供查询收录的工具,任何第三方提供的所谓收录查询都是不靠谱儿的。站长可以通过LOG日志分析估算收录,注意真假Baiduspider(《如何识别百度蜘蛛》)

真实索引量只能通过百度站长平台索引量工具查询

 目前有第三方开发的工具可以辅助分析索引中页面的引流能力,如site:www.bbsxiaomi.com(第三方工具,仅供参考) 


小米技术社区

本站内容均为小米原创,转载请注明出处:小米技术社区>> 什么是网站的收录量和索引量?其区别是什么?