
| 出版日期:2000-12-25 总期号:984 本年期号:96 |
|
用信息技术构筑信心
第五次人口普查数据处理系统 李柠 大多数人可能将人口普查的概念定格在普查登记这一工作上,殊不知在普查登记之后,还有更庞大的工程、更艰巨的任务——数据处理。为此,我们特地采访了国家统计局计算中心主任徐铁夫先生和总工程师滕若波先生,在他们的帮助下,我们才得以深入了解到很多。 在谈到有关人口普查的经费问题时,记者得到一个对比,对于2000年人口普查,美国计划投入65亿美元,人均大约在35美元左右;而在中国,国家与各地区的投资加起来,一共不超过40亿元人民币,也就是说,人均不超过3元。另一方面,从整个人口普查的周期来看,美国从2000年4月1日开始人口普查,计划到2003年9月份,才将所有人口普查数据公布完毕;而中国的人口普查从2000年11月1日开始,到2001年底就向外界公布人口普查数据。 “这是国家最基本的调查” 人口普查是一个国家最基本的调查,世界上几乎所有的国家都进行过自己的人口普查工作。而2000年正好处于世纪之交,无论是一个国家,甚或世界,都有必要进行一次人口普查,此次人口普查的结果,将作为人口历史的年轮载入世纪的篇章。尤其中国,是世界上人口最多的国家,并且,第五次人口普查是第一次没有联合国的援助,完全由中国自己的资金、自己的方案、自己的技术来进行人口普查的所有工作。世界各国都在密切关注中国的人口普查工作,普查工作的成功与否将在一定程度上反映中国的国是调查能力。所以,对于承担人口普查工作的国家统计局来说,第五次人口普查是工作中的重点之重点,无论是普查登记,还是数据统计与处理,他们都倾注了大量的人力与物力,以保证工作万无一失地进行。 “数据处理工作是关键” 第五次人口普查的标准时间是2000年11月1日零时,经过一个多月600万名普查登记人员的努力,共约400万个调查小区的普查登记工作陆续完成。接下来的工作,便是要对全国约36000万张普查短表、4000万张普查长表、500万张死亡表、500万张暂住人口调查表完成普查表的数据录入和处理。 第五次全国人口普查数据处理系统是在国家统计信息广域网基础上运行的在线数据处理系统,以Oracle8i 8.1.5 数据库和数据仓库技术为核心,综合运用了Java、JavaScript、html、Dhtml、C++/ProC、OAS等先进技术和开发工具,严格按照软件工程方法进行开发的大型系统软件,可以在线完成人口普查数据的加载、预处理、审核、编辑、汇总及汇总报表下载等任务。 在人口普查数据处理过程中,人口普查的原始人口登记表在地市以县为单位进行光电录入,然后将数据通过网络(或光盘)上报到各省统计局。省统计局将数据导入到数据库,建立本省的人口普查数据处理网站,并通过该网站对数据进行处理,同时按不同权限向社会和其他有关部门发布人口信息。地市级统计局通过光电录入设备将人口普查登记表转换为电子形式的数据,通过计算机进行审核和净化。审核后的数据进行打包,经压缩后,通过OpenMail电子邮件系统把数据报送到省统计局。没有网络条件的城市可以采用光盘为介质报送数据。省级统计局在收到打包并压缩后的原始数据文件之后,将文件解压并解包导入到各省的Oracle数据库服务器中,各省均建立人口普查数据处理网站,各省人口普查数据处理网站的Web服务器直接和数据库服务器相连。数据处理用户通过统计信息网或通过163网访问各省的人口普查网站,对数据进行审核、处理和查询。 人口普查数据处理流程图见图1。在该图中,地市处理完的数据在报送省之前要进行压缩,并通过统计信息网/163网进行传输,使用OpenMail系统将数据上报到省统计局。在需要使用数据时,数据处理人员通过统计信息网/163网访问人口普查数据处理网站,社会用户通过163网,经身份认证,访问人口普查对外发布网站。在整个系统网络中,地市通过专线与省统计局局域网相连,通过当地163拨号上网,这种方案出现问题时,可以采用地市拨入省统计局的拨号服务器的备份方案。 从这种数据处理流程和采用的网络传输方式来看,第五次人口普查数据处理系统主要有下面的特点: ●数据全面采用国家统计信息网络进行传输 ●使用Internet技术弥补统计网络覆盖面不足的问题 ●数据处理采用分省集中方式处理 ●国家和省分别建立网站 ●省级系统作为数据处理中心,国家级系统作为整个网络的控制中心 “统计工作要依靠信息化的发展” 在12月初召开的“第五次全国人口普查网络运行与网络安全工作会议”上,徐主任就一直强调,21世纪各国的竞争力主要体现在信息化方面,而信息时代的重要途径就是网络,统计行业的发展也要与计算工具的发展紧密联系,所以从统计工作的角度来看,技术方案的选取一定要按照信息化发展的方向,要带有一定的前瞻性。谈到此次人口普查数据处理系统,徐主任和滕总工程师都谈到了以下几个重要特点: 第一, 充分利用已有的系统环境和技术 从两位主要负责人谈话中得知,此次人口普查的数据处理系统,有很大一部分都利用了在“九五”计划中就已经搭建成功的全国统计系统骨干广域网,已经有5000家工业企业和3000家房地产企业实现了网上报送,所以在硬件投资上,就节省了很大一部分资金。并且,在整个系统方案设计中,也充分考虑资金的利用和设备的效率问题,比如,在光电扫描仪的选择和使用上,就采用了租赁方式,大大减少了投入。而对于其他设备,诸如服务器、微机、网络设备等的选型方案,不仅要考虑到现在实用,还为今后的统计系统骨干应用网的建立作了充分的准备,以避免将来的重复投资。 第二, 采用了先进的光电录入系统 普查表的录入工作主要依赖光电录入系统,光电录入系统的主要技术是OCR(光电字符识别)技术。在说到这一点时,徐主任非常兴奋地告诉记者,在1996年进行农业普查时,是第一次采用OCR技术,当时参加招标的国内公司只有3家,并且只能实现单面扫描。而在1998年进行第五次人口普查的系统招标时,居然有10多家国内公司参加此项目的竞标,并且能实现双面扫描。由此可以看出,国内的信息化技术正以迅雷不及掩耳的速度发展。也可以自豪地说,我们完全用自己的技术方案来完成自己的“家事”。 第三, 采用了先进的网络安全系统 从“九五”计划开始实施以来,国家统计局就一直着力于网络安全系统的建设。统计系统的骨干应用网中的网络安全系统已经得到了国家的认证。这次人口普查的数据传输工作和将来的数据处理和查询,就要依赖这个安全系统的保护,所以它在整个网络系统中也有举足轻重的作用。 最后,徐主任就自己在整个人口普查数据处理系统建设过程中的亲身体验,谈到还是希望国家能够继续加大力度来进行基础建设,进一步改善网络应用环境,为所有的政府机关搭建一个统一信息标准的网络平台,从而更好地在各个政府部门之间实现信息共享。 五普动态: ●普查登记工作已经完成,人口普查进入数据处理阶段。 ●12月13日,国家统计局召集了全国31个省的技术骨干在清华进春楼召开第五次全国人口普查网络运行与网络安全工作会议,在会议结束后将进行4天时间的关于人口普查数据处理网络和安全系统的培训。 ●计划2001年2月份进行省级数据库与网站的培训。 ●计划2001年6月份完成光电录入工作。 ●计划2001年10月份完成数据处理工作。 ●计划2001年底公布普查结果。 |
|||||||||||||||||