查字典范文网 >> 2003年中国互联网络信息资源数量调查报告

2003年中国互联网络信息资源数量调查报告

小编:

信息资源数量调查报告 主持单位:国务院信息办推广应用组 承办单位:中国互联网络信息中心 完成时间: 2004年2月 (本文图均略) 目 录 第一部分 调查背景 1 第二部分 调查说明 2

一、调查对象 2

二、调查内容 2

三、调查时间 3

四、有关概念 3

五、调查方法 4

六、调查问卷 7

七、组织单位 7 第三部分 调查结果 9 第一章 域名、网站数及地区分布 9

一、域名数 9

二、网站数 10 第二章 网站性质及服务内容 12

一、网站按性质分类 12

二、网站的基本情况 13

三、各类型网站信息服务内容及信息更新情况 29 第三章 网页数量及性质特征 60

一、全国网站的网页情况 60

二、国内前100家大型网站的网页情况 63

三、全国网站的网页与国内前100家大型网站的网页情况比较 65 第四章 在线数据库数量及性质 67

一、在线数据库数量及各类网站拥有在线数据库情况 67

二、在线数据库按内容和记录数分类情况 70 第五章 总结 79

一、域名统计 79

二、网站统计 79

三、网页统计 85

四、在线数据库统计 86 图目录 图 1 地区域名数量分布 10 图 2 www站点性质分类 10 图 3 地区网站数量分布 11 图 4 不同性质类型网站分布图-饼状图 12 图 5 不同性质类型网站分布图-柱状图(%) 13 图 6 平均每个网站每天的页面访问数 13 图 7 网站每天的页面访问数-按类型分布 14 图 8 企业网站每天的页面访问数-按行业分布(%) 15 图 9 制造业企业网站每天的页面访问数(%) 16 图 10 it业企业网站每天的页面访问数(%) 16 图 11 各类网站的网站链接情况 17 图 12 各网站链接数的网站比例 18 图 13 各类网站的信息主要来源情况 19 图 14 各类网站提供的语种/文字阅读情况 20 图 15 各类网站提供全站信息搜索的情况 21 图 16 各类网站的网页上提供网站地图的情况 21 图 17 各类网站的网页上提供联系方式的情况 22 图 18 各类网站服务器拥有情况 22 图 19 拥有服务器的网站比例 23 图 20 各类网站拥有服务器情况 24 图 21 拥有服务器的各类网站所采用的操作系统情况 25 图 22 负责网站运营的全职员工人数情况 26 图 23 各类网站负责运营的平均全职员工人数 26 图 24 各类网站负责运营的全职员工人数拥有情况 27 图 25 网站的成立时间-饼图 28 图 26 提供各类信息服务的政府网站的比例 30 图 27 政府网全部在线数据库的比例 67 图 84 各类网站拥有在线数据库的比例 68 图 85 各类网站/平均每个网站拥有数据库数量情况 69 图 86 各类网站平均拥有在线数据库数量情况 69 图 87 拥有不同在线数据库数的网站比例 70 图 88 拥有各类在线数据库的网站比例情况 71 图 89 各类在线数据库平均拥有的记录数 72 图 90 各类在线数据库的更新周期情况 73 图 91 各类在线数据库的每次更新比率情况 75 图 92 各类网站在线数据库具有其它载体情况 76 图 93 各类网站在线数据库具体载体形式 76 图 94 在线数据库收费情况 77 图 95 在线数据库面向对象情况 78 表目录 表 1 调查内容和指标 2 表 2 地区域名数量分布 9 表 3 www站点性质分类 10 表 4 地区网站数量分布 11 表 5 各类网站的网站链接情况 17 表 6 各类网站的信息主要来源情况 18 表 7 各类网站提供的语种/文字阅读情况 20 表 8 各类网站拥有服务器情况 23 表 9 拥有服务器的各类网站所采用的操作系统情况 25 表 10 各类网站负责运营的平均全职员工人数拥有情况 27 表 11 网页数及网页字节数情况 61 表 12 网页的编码情况 62 表 13 网页的内容分类情况(按多媒体形式) 62 表 14 网页的更新周期情况 62 表 15 前100家网站的网页数及网页字节数情况 63 表 16 前100家网站的网页编码情况 63 表 17 前100家网站的网页内容分类情况(按多媒体形式) 64 表 18 前100家网站的网页更新周期 64 表 19 在线数据库数量及分布情况 67 表 20 各类网站拥有在线数据库情况 68 表 21 拥有各类在线数据库的网站比例情况 70 表 22 各类在线数据库平均拥有的记录数 71 表 23 各类在线数据库的更新周期情况 73 表 24 在线数据库的每次更新记录比率情况 74 表 25 在线数据库的载体情况 75 表 26 各类网站在线数据库具体载体形式 76 表 27 在线数据库收费情况 77 表 28 在线数据库面向对象情况 78 第一部分 调查背景 信息资源是国家的战略资源,它在国民经济信息化中位于核心的地位。正确开发、利用信息资源对促进我国信息化的快速发展,导正我国信息化的发展方向,拉动国民经济和社会发展,提高全民族的文化素质和创新能力,促进社会进步和繁荣,实施西部大开发战略等方面有着十分重要的意义。

互联网络信息资源是信息资源的重要组成部分,自从20世纪90年代中期开始,互联网在我国迅猛发展,网上中文信息资源快速增长,到2002年12月31日,全国在线数据库达到82929个,共15709万个网页,2744g数据量。网上政府信息、行业和企业信息、科技教育信息、文化娱乐信息、新闻信息、旅游信息、区域特色信息等均已形成一定规模。

随着互联网络的飞速发展,我国互联网络信息资源得到了很大的发展,但是我国互联网络信息资源不断按性质分类比例 问卷调查 政府、企业、商业网站等 按地域分布比例 华北、华南等七大区分布 按内容分类比例 产品、科技信息数据库等 按形式分类比例 图形文字数据综合等 按使用情况分类比例 分自用和公用 公用下分免费和收费 收费下分收费方式 按服务方式分类比例 面向终端用户或中介 在线数据库更新状况 - 数据库容量 物理存储量(g) 是否同时具有其它载体 否、是(光盘、纸质等)

三、调查时间 调查时间:2003年12月-2004年2月;数据截至时间:2003年12月31日。

四、有关概念 1. 在本次调查中,中国互联网络信息资源定义为:中国互联网络上公开发布的网页和在线数据库的总和。 2. 中国互联网络是指所有域名注册单位属于中国大陆的网站总和。

3. 在线数据库是指以web为界面,提供公共检索的收费或免费的数据库。 4. 网站是指有独立域名的web站点,其中包括cn和通用顶级域名(gtld)下的web站点。

此处的独立域名指的是每个域名最多只对应一个网站www.+域名,如:对域名sina.com.cn来说,它只有一个网站 www.sina.com.cn ,并非它有news.sina.com.cn、mail.sina.com.cn……等多个网站。 5. 商业网站指业务主要在网上进行的电子商业网站,如新浪、搜狐、网易等网站;企业网站是相对于商业网站而言,指业务主要在网下进行的企业所建立的网站,如联想集团的网站 www.lenovo.com.cn 。

6. 网页搜索是指对抽取的网站从其首页(www+域名)开始搜索,通过网页上的层层链接,抓取所有属于该网站的网页的特征及其文本内容。 7. 静态网页是指url中不含?和输入参数的网页,包括:*.htm、*.html、*.shtml、*.txt、*.xml等。

8. 动态网页是指url中含?或输入参数的网页,包括:asp,php,perl,cgi等在server方进行处理的网页。 9. 网页的编码形式:是根据网页本身的信息通过分析得到的,不是通过一篇网页在html中的声明来判断的。

因为大量国内的英文网页在其html声明中都是简体中文。 10. 网页的内容形式:是通过文件后缀获得的。

关于图像、音频、视频的文件后缀定义标准参考mime标准。 11. 网页的更新情况:网页的更新时间是指搜索到该网页的当日日期与该网页的最后更新日期之间的时间段。

五、调查方法

(一)数据获取方式和渠道 域名和网站的总量数据通过国内各国际域名注册商和cnnic联合获得。 网页的特征数据由百度公司利用搜索技术对全国网站进行搜索获得。

搜索时通过url判断同一网页是否有多个链接指向,避免了对这类网页的重复计算,通过判断不同网站的ip地址和首页字节数是否相同,排除了不同域名指向同一网站的情况。 网站的特征数据及在线数据库的特征数据通过call center电话问卷调查的方式获得。

(二)调查问卷的抽样方法 1.总体界定 按照对中国互联网络信息资源的定义(中国互联网络上公开发布的网页、在线数据库的总和),同时考虑到未注册域名而提供服务的网站数bsp;23 四川 31 新疆 8 黑龙江 16 河南 24 贵州 步骤4:抽取样本 以第i个域名注册/代理商、抽取第j类样本的过程为例叙述如下。第i个域名注册/代理商在第j组域名列表中抽取出指定数量的mij个域名作为其提供的第j类域名的样本,抽取的规则如下:首先计算一个抽样距离xij(xij=round(nij/mij)),xij为第i个域名注册/代理商在第j类样本中的抽样间距,然后随机从1到nij中选出一个数s,那么编号为p=s+k*xij(k=0、

1、

2、3 m ij-

1)的域名即为被抽取的样本域名(当p>nij时,取p=p-nij)。 其他组的样本抽取过程类似,将各组中抽取到的样本综合到一起可组成第i个注册/代理商应抽取的样本。

步骤5:获取样本相关资料 将以上步骤所抽取的样本域名及其相关信息(包括:域名、域名类型、域名注册时间、域名所属单位、域名单位所在地、域名联系人、联系电话等)存为excel工作表文件。格式如下: 序号 域名 域名类型 域名注册时间 域名所属单位 域名单位所在地 联系人及联系方式 1 cnnic.net.cn net 北京 将所有注册/代理商提供的样本合并即成为调查所需样本。

六、调查问卷 本次问卷调查的有效网站样本数为2492个,在置信度为95%的精度要求下,可保证最大允许绝对误差小于2%。 调查问卷时间为2003年12月-2004年2月。

问卷所采集数据的相应记录时间为2003年12月31日。

七、组织单位

1、委托单位: 国务院信息化工作办公室

2、实施单位: 中国互联网络信息中心(cnnic)

3、协助单位(按字母排序): 百度在线网络技术(北京)有限公司 北京东方网景信息科技有限公司 北京信海科技发展公司 北京信诺立兴业网络通信技术有限公司 创联万网国际信息技术(北京)有限公司 东方通信股份有限公司 搜狐爱特信信息技术(北京)有限公司 厦门必信电脑网络有限公司 厦门精通科技实业有限公司 厦门中资源网络服务有限公司 第三部分 调查结果 (以下调查结果截止到2003年12月31日) 第一章 域名、网站数及地区分布

一、域名数 1. 全国域名数:1187380个 注:包括cn域名和通用顶级域名(gtld),不含中文域名。 2. 分地区域名数比例 表 2 地区域名数量分布 北京 天津 上海 重庆 安徽 15.2% 1.6% 11.8% 1.1% 1.3% 福建 甘肃 广东 广西 贵州 6.7% 0.4% 16.2% 1.0% 0.3% 海南 河北 河南 黑龙江 湖北 0.4% 1.9% 1.9% 1.4% 2.5% 湖南 吉林 江苏 江西 辽宁 1.9% 0.9% 7.2% 0.7% 3.6% 内蒙3.2%,其它类型占1.1%。

如下图所示。 注:商业网站指业务主要在网上进行的电子商业网站,如新浪、搜狐等网站;企业网站是相对于商业网站而言,指业务主要在网下的企业所建立的网站,如联想集团的网站 www.lenovo.com 。

图 4 不同性质类型网站分布图-饼状图 图 5 不同性质类型网站分布图-柱状图(%)

二、网站的基本情况 1. 网站每天的页面访问数 图 6 平均每个网站每天的页面访问数 图 7 网站每天的页面访问数-按类型分布 图 8 企业网站每天的页面访问数-按行业分布(%) 图 9 制造业企业网站每天的页面访问数(%) 图 10 it业企业网站每天的页面访问数(%) 2. 网站的链接数 表 5 各类网站的网站链接情况 (%) 政府 网站 企业 网站 商业 网站 教育科研 机构网站 个人 网站 其它非盈 利机构网站 总体 (加权) 没有链接 17.1 48.5 15.2 22.9 43.1 24.5 41.4 1-5家 22.2 30.8 23.2 37.2 25.2 30.9 29.9 6-10家 16.3 11.2 42.4 13.1 14.1 23.8 15.0 11-20家 22.2 5.6 9.1 12.4 10.1 12.2 7.4 21-50家 13.3 2.4 4.5 5.9 4.9 5.0 3.6 51家及以上 8.9 1.5 5.6 8.5 2.6 3.6 2.7 备注:网站总体情况为各类网站加权平均所得,权数为各类网站占总网站的比例 图 11 各类网站的网站链接情况 图 12 各网站链接数的网站比例 3. 网站信息的主要来源 表 6 各类网站的信息主要来源情况 (%) 政府 网站 企业 网站 商业 网站 教育科研 机构网站 个人 网站 其它非盈利 机构网站 总体 (加权) 自己采集 92.6 90.5 83.8 94.1 76.1 81.3 88.8 传统媒体 32.6 18.5 24.2 24.8 20.9 30.9 20.6 其他网站 38.5 24.8 37.9 44.4 51.6 41.7 30.1 商业企业提供 30.4 19.0 40.4 11.1 10.5 23.0 20.4 其他 11.9 5.8 9.1 11.1 11.1 20.1 7.6 网站 其它非盈利 机构网站 总体 (加权) windows 81.3 79.9 67.1 88.5 80.3 79.2 79.5 unix 9.4 8.0 13.9 16.7 4.2 4.2 8.7 linux 15.6 11.3 24.1 14.1 21.1 18.8 13.6 其他 4.7 7.2 8.9 1.3 1.4 2.1 6.3 图 21 拥有服务器的各类网站所采用的操作系统情况 10. 负责网站运营的全职员工人数 图 22 负责网站运营的全职员工人数情况 图 23 各类网站负责运营的平均全职员工人数 表 10 各类网站负责运营的平均全职员工人数拥有情况 (%) 政府网站 企业网站 商业网站 教育、科研机构网站 个人网站 其它非盈利机构网站 总体 (加权) 0人 6.3 10.6 4.0 7.4 3.5 7.7 9.1 1人 18.7 30.4 4.0 25.5 63.6 23.1 29.3 2人 20.3 21.0 11.5 16.8 13.4 14.6 19.0 3人 16.4 15.7 9.8 16.8 10.3 16.2 15.1 4-6人 20.3 12.5 15.8 20.8 9.2 24.5 13.9 7-9人 4.7 2.7 14.0 2.0 0.0 6.2 3.7 10人及以上 13.3 7.1 40.9 10.7 0.0 7.7 9.9 图 24 各类网站负责运营的全职员工人数拥有情况 11. 网站的成立时间 图 25 网站的成立时间-饼图

三、各类型网站信息服务内容及信息更新情况 1. 政府网站

(1)政府网站信息内容提供情况 政府网站所提供的主要信息服务包括:政府新闻、政府职能/业务介绍、统计数据/资料查询、法律法规/政策/文件、办事指南/说明、办公/业务咨询、政府通知/公告、办事进程状态查询、企业/行业经济信息、便民生活/住行信息、表格下载等。此外还对信息是否按政府、企业及公民进行了分类、是否具有信息搜索功能、是否提供网站链接、以及阅读语种等进行调查。

调查结果显示: 关于信息服务,绝大多数的政府网站提供法律法规/政策/文件(83.7%)、政府职能/业务介绍(82.2%),大多数的政府网站提供办事指南/说明(74.8%)、政府新闻(71.1%)、办公/业务咨询(

热点推荐

上一篇:小区物业调查报告(初中学生)

下一篇:初中语文八年级教学总结范文(15篇)

基层供电所年终工作总结(实用13篇) 心理课拍卖游戏心得体会(精选19篇)