ccidnet????

出版日期:1999-09-06 总期号:855 本年期号:65

本期导读
要闻综合
电脑工作室
市场
硬件
软件
infotimes
图书馆应如何管理因特网信息资源

赵培云

  随着因特网在世界范围的迅速发展,越来越多的的数据库和信息系统不断加入网络,使网上信息的种类和数量不断增加,因特网已成为目前世界上资料最多、门类齐全、规模最大的信息资料库,因而有人称其为“全球最大的图书馆”。由于因特网上的信息资源在很大程度上处于混乱的无政府主义状态,这又使巨量信息的查询、检索十分困难,大大影响了网络信息资源的利用效率。针对这一问题,计算机专家和网络爱好者在短短几年间,开发了多种搜索引擎。然而,网络检索工具的出现,并不能全面改善网络信息的无序和大量冗余信息、不稳定信息充斥网络。人们在检索学术性信息时,往往从专门学科入手,而网络检索工具不以专业划分,在查询某一特定学科网络信息时,一方面没有专门的网络检索工具,另一方面又是任何一个网络检索工具都可以用,致使检索效果不理想。而且,对于一直习惯于上图书馆查阅资料的众多普通读者来说,他们不熟悉网络检索工具,在终端上只能获得表层信息,与在图书馆获取经过严格筛选的、精心组织的系统化文献及计算机化数据库文献,是绝对不同的。因此,网上巨量的信息要想得到广大图书馆读者的“青睐”,必须经过图书馆的技术加工过程,这一则可提高网络信息的有序化程度,拓展图书馆馆藏资源,二则可大批量地扩展因特网用户,使任何一个读者都能像上图书馆查书那样,方便地利用网络信息资源。


  美国图书馆对因特网信息资源的组织管理


  美国图书馆对因特网信息进行选择、加工,使其成为方便读者利用的本馆网络资源,很值得我们深思。

  近年来,国际联机图书馆中心(oclc)开始了一项“给因特网编目”(cataloging the internet)的研究计划,通过成员馆对网上信息资源应用usmarc格式和aacr2进行标准化编目。目前,首列的对象为网上电子期刊,因此许多期刊出现双版制,即在出版印刷版的同时,又出版电子版直接投入网络。oclc这项编目计划,在成员馆之一的弗吉尼亚大学alderman图书馆已经开始实施,并已形成有关工作标准。如在usmarc的130字段(uniform title,main entry)使用online作为电子刊物的修饰词,补充了856字段(electronic location and access),国会图书馆出版了有关它的一系列使用规则,该字段被指定提供url或其他因特网网址。当然,被编目的网上电子期刊是经过严格选择的。以此,逐步实现所有有用的文献信息被有序控制、便于查询的理想状态。

  美国研究图书馆在近二三年中,在组织网络信息成为虚拟馆藏方面做了大量的工作。如麻省理工学院(mit)图书馆的专门网页,以选单方式组织了“虚拟参考馆藏”,该网页将经过选择的网络信息资源分成29个类目,包括211个网络站点或网上数据库入口。以学术性信息为主,如学科性类目,地学、卫生、法律、政治、统计、科学等等;机构性类目,学会与协会、高等院校、公司、工厂、政府等名录与信息数据库;各类字典、百科全书等网上全文工具书。实用性类目为辅,如工作与雇佣、基金、税务、消费与各类指南、旅行、天气等信息。mit图书馆还根据本校需求,设计了专利信息网页,指导读者如何获取专利文献及全文,并给出9种网上的专利数据库,都有再次进入的联接点,可进行检索。此外,其他大型图书馆的opac及虚拟馆藏的联接点,对因特网搜索引擎以及覆盖面大的具有检索工具作用的站点,均特别给出联接点,扩展了本馆特藏。


  我国图书馆如何对因特网信息资源进行组织管理


  图书馆整套业务运行作用于网络信息资源,给图书馆的信息搜集创造了广阔的自由空间,并改善了因特网信息的有序化程度,弥补了网络检索工具的不足。对经济能力有限的我国来说,网络利用率不高,12亿人才有400多万用户,资源闲置、浪费严重。因此,从图书管理、利用的角度对因特网信息资源进行科学、系统的组织管理,以适应广大读者的信息需求,显得尤为重要。

  1.政府应从经费、设备等方面对图书馆开发组织因特网信息资源给以优惠支持,并强调标准和规范的统一。与美国图书馆相比,我国大多数图书馆经费紧张,内部业务自动化水平还很低。作为全国图书馆最具实力的1000多所高校馆中,与cernet网连通的也只有300多所。条件好的馆建有光盘检索室,提供少量光盘数据库,一部分馆虽已建立了馆网,但只提供因特网终端,将因特网信息资源作为本馆虚拟馆藏为读者服务的,只有数得着的几家,而且服务也不规范。在图书馆中,除负责自动化建设及情报服务的部门外,其他业务工作仍维持在原有的手工操作状态。在这种情况下,探讨开发组织网络信息资源,离开政府的优惠支持是很难行事的。而从美国有关工作的经验来看,政府主要应发挥三方面的作用:一是要资肋“全国高校文献资源保障体系”(calis),对计划实施给予经费保障;二是要提供优惠的开发设备和环境;三是以《中图法》、《汉表》为依据,制定有关规范和标准,并监督规范和标准的执行。

  2.实行总体规划、分工合作,开发特藏的原则。我国现有中文搜索引擎,由于开发比较分散,各自为政,缺乏统一协调和合作,重复现象较多,造成人力、物力、财力的浪费,加之图书馆技术力量参差不齐,所以,对图书馆开发组织网络信息资源实行总体规划、分工协作、各自开发特藏的原则很有必要。教育部的calis计划中的一个子项目“重点学科导航库”,就是各中心馆分学科对因特网信息资源进行组织的一个计划。该计划强调宏观决策为第一步,实施过程中,将始终坚持整体效益原则、合作协调原则,这样就有效地克服了开发网络信息资源中个体重复与总体贫乏交互存在的现象。

  3.各中心馆应以上述标准、规范、原则为依据,集有生力量,与有关的信息技术公司合作,联合进行技术攻关,开发基于web各自学科特色的学科网络导航系统。

  ■实现中文编码之间的自动转换。当前,网上中文信息存在编码不一致的问题(有的用gb码,有的用big5码),许多搜索引擎只能查询某一种编码的中文信息。为了全面查询全国各地(包括台湾)等地、甚至全世界的中文信息,图书馆搜索引擎应实现中文编码间的自动转换。

  ■将机器人和人工信息搜寻方式结合起来,做好信息搜集工作。当前搜索引擎的信息搜集方式有机器人自动搜寻方式和人工搜寻方式。机器人方式搜集的信息快速、全面,但质量和准确性难以保证;人工方式速度慢,但搜集到的信息一般准确性高,质量较好。因而,应将两者结合起来,互相补充,从而提高搜索引擎查询信息的质量。

  ■开发集成化网页搜索系统。目前网上大多数的中文搜索引擎都是单搜索引擎。用户在查询信息时,若在第一个搜索引擎没有找到满意的结果,于是便在第二、第三个……搜索引擎间奔波,为找到满意的结果而费时费力。这说明现有网页搜索系统在搜索结果的数量和质量上还不能满足用户需求。因此,应开发集成化的网页搜索系统,以汇集所有的网页搜索系统,并提供一个统一的界面,用户只需进行一次提问,集成化网页搜索系统就将其适当格式化以后,提交给不同的网页搜索系统搜索,然后将返回的搜索结果进行整理、合并,集成为一个页面或一份报告,带回搜索引擎。这种搜索可大大地节省搜索时间,提高搜索效率,搜索结果也比较全面、准确。

  ■采用最新的全文搜索技术,注意全文搜索引擎的开发。目前的中文搜索引擎多以分类为主,再辅之以简单的关键词全文检索方式。这样对信息的查全、查准率都不理想,所以,为了满足用户快速、准确地查询信息的需求,应采用最新的全文搜索技术,开发如主题词、网站名、主机名、题名、作者名等多种查询选择方式并存,功能强大的分类中文搜索引擎。

  ■将搜索到的信息,按《中国图书馆图书分类法》所规定的22大类,即马列主义、毛泽东思想(a),哲学(b),社会科学总论(c)……等类目分类。并按cnmarc进行标准编目,根据题名、作者、主题词、关键词等检索汉语拼音音序排序,建立搜索引擎数据库。当然,最重要的是数据库内容必须经常更新、重建,才能保持与因特网同步发展。

  ■建立工具书的超文本数据库。其中包括对各种工具书如百科全书、年鉴、手册、词典等性质、特点和使用方法的介绍;提供按学科或工具书类型检索的途径;每本工具书要有指向收藏它的阅览室的主页的链接。

  ■为有针对性地提高某些科研人员的查检速度和查准率,应将一些著名的数据库公司,如dialog、stn和oclc等,和其他的网上收费或不收费的外文数据库的url地址,按英文字母顺序排列起来,做成超文本文件,供他们使用。

  ■建立超文本的检索指南,介绍各种检索课题的检索要点。除上述几点外,学科网络导航系统还必须稳定可靠,具有完整的容错、备份、崩溃修复机制,系统即使出错,也可以得到迅速恢复。

  因特网信息资源的组织管理是一个相当复杂的工作。目前还有许多难点有待解决,诸如新陈代谢快、信息不稳定、积累与保存困难等,而且鉴别和选择网络信息资源远比图书馆采访印刷型文献复杂得多。但是,我们也应该看到,我国图书馆实施这项任务已有了良好的开端,只要我们能够紧密跟踪世界上开发组织网络信息资源方面的先进技术,借鉴他人的经验和自己已有的成果,我们完全有理由相信:内容丰富、方便国人利用的网上虚拟图书馆将很快在我国建立起来。