ccidnet????

出版日期:2002-06-24 总期号:1128 本年期号:45

本期导读
要闻综合
中国信息化
网络与通信
软博会专刊
藏典3号
渠道与市场
2002年暑期采购特刊
东北专刊
华东专刊
华南专刊
西北专刊
西南专刊
如何建立一个数字图书馆

刘锦山

  第五届中国北京国际科技产业博览会于5月23日至28日举行。本届科博会暨国际周以奥运、创新、发展为主题,并围绕着加入世贸、奥运和科技三大系列设立了16个论坛。设在北京国际展览中心的产品展示会场以琳琅满目、千奇百怪的高科技产品吸引了众多参观者。

  数字图书馆是一个复杂的系统工程,建立一个完善的数字图书馆,必须未雨绸缪,提前做好整体规划,认真、全面、细致地考虑到建立数字图书馆所要解决的问题。

  对于一般单位来说,建立一个数字图书馆,需要从如下几个方面着手:网络环境的建设、数字图书馆硬件设备的建设、数字图书馆软件系统平台的建设、数据库资源的建设、图书馆自动化系统的建设、面向读者的推广应用等。


  网络环境建设


  现代数字图书馆本质上是基于网络环境下的海量数据库及其应用。一般的数字图书馆只是在WINDOWS NT环境下运行的,客户端都是基于WINDOWS操作环境的。个别数字图书馆不仅可以在WINDOWS网络环境下运行,而且还可以在UNIX和LINUX环境下运行,其普适程度更高。比如书生之家数字图书馆就有WINDOWS NT版和LINUX 版两种版本。众所周知,UNIX的安全性要比WINDOWS NT好,这也是不少资金雄厚的大型单位网络系统选择UNIX的原因所在。当然,UNIX的投入也要比WINDOWS NT的大。

  对于一般单位而言,WINDOWS NT环境不失为一种既经济适用、简单易学、容易维护的网络环境,又适合所有数字图书馆的产品。


  硬件设备建设


  数字图书馆硬件设备主要包括数字图书馆专用服务器和存储设备。数字图书馆专用服务器用来存放和运行数字图书馆软件系统平台。不同的数字图书馆产品对服务器性能的要求有很大的不同,就是同一数字图书馆产品由于受读者数量、网络情况等因素的影响,其对于服务器的性能需求也不一样,有时差别还很大。比如,一个10000人的学校和一个70000人的学校,其数字图书馆专用服务器性能差别就非常大。一般地,大多数数字图书馆软件系统平台只能存放和运行在一台服务器上,这样,将来的可扩充性就很差,而且扩充成本很高。如果能将数字图书馆软件系统的WEB系统、数据库系统、原版数据系统分开存放于不同的服务器,那就既增加了系统的安全性,又增强了其易扩充性,而且扩充成本还比较低。当然,对于一般的单位而言,这三种服务器完全可以合在一起使用。

  下面以书生之家数字图书馆为例说明对数字图书馆专用服务器的需求:


  如图所示,读者在客户端通过IE发出一个查询、检索指令,这个指令传到WEB服务器,WEB服务器同时将请求发送到SQL server 服务器,SQL server 服务器根据请求生成一个结果发回到WEB服务器,WEB服务器将这个结果转换后发回到客户端,读者在客户端就得到自己需要的书目或篇目结果。如果读者想进一步阅读全文,他就通过客户端向阅读器发送阅读全文指令,这个指令通过阅读器又发送给原版数据服务器,原版服务器通过这个指令到数据存储设备将原版数据“取出”,然后将其再发送到客户端,读者就可以读到全文的图书了。

  从图中可以看出,因为采取了分布式的设计,所以大大增强了系统的安全性能,同时这样的结构也极易扩展,而且成本很低。

  一般地,原版数据服务器性能要求相对低一些,WEB服务器性能要求相对高一些,SQL server服务器性能要求最高。但是,对于10人以下的单位,三个服务器完全可以合并,物理上采用一个服务器就可以了。这个合并后的服务器一般的配置如下:PⅢ650以上的双CPU、512M内存、10G的硬盘。这样的配置足够一般的单位使用了。

  数字图书馆硬件建设的第二个重要部分是存储设备的建设。软盘、CDROM、DVDROM、硬盘、硬盘阵列等等是常见的存储设备。数字图书馆的成熟,从硬件条件上讲,是与网络和大容量存储设备的出现分不开的。没有这两者,就不会有真正意义上的数字图书馆。根据数据量的不同,磁盘阵列的容量也有很大的不同。这里需要注意的是,各种数字图书馆产品由于数据生产加工技术和手段不同,加工出来的数据所占空间有着非常大的区别。比如,使用PDG技术加工一本300页32开的图书,其空间从15M到60M不等;而采用书生全息数字化技术加工同样的图书,其空间只有1M到4M,二者相差几倍到十几倍。这一点对于数字图书馆的建设异常重要,它直接决定了在硬件方面的投入,影响着数据资源的投入。

  在数字图书馆硬件建设方面,容易犯的一个毛病是片面追求一步到位和高档次,将大量的资金用于购置昂贵的硬件设备上。殊不知,数字图书馆的核心是数字资源。没有资源,再好的硬件无异于一堆废铜烂铁。所以,在硬件设备建设上一定要从实际出发,量力而行。


  软件系统平台建设


  完整的数字图书馆软件系统平台包括制作系统、发布系统、应用平台、网站管理系统、全文检索系统和阅读器等。

  制作系统是将原始资料数字化的系统,发布系统是将制作系统数字化后的数据发布到数字图书馆之中,供用户和读者使用。对于大多数用户,建立数字图书馆所需的数字化资源一般都是由专业的厂商提供,所以制作系统和发布系统一般不需要配备。

  应用平台对于用户和读者来说是进入数字图书馆的一个入口,分为局域网镜像站点和Internet镜像站点两种版本。大多数用户使用的都是局域网镜像站点。应用平台为用户和读者提供了使用界面,并将网站管理平台、全文检索系统、阅读器等集成在一起,提供用户和读者使用。

  网站管理系统包括数据追加、网站维护、用户管理、流量监控等功能,分为Intranet版和Internet版两种版本。需要指出的是,并不是所有的数字图书馆产品都提供网站管理功能。

  全文检索系统是数字图书馆系统必不可少的核心部分,数字图书馆的易用性很大程度上通过全文检索系统得以体现。一般地,全文检索系统提供了分类检索、标题检索、作者检索、单位检索、摘要检索、主题词检索、引文检索、基金检索、全文检索、二次检索等的检索功能。

  阅读器能给读者提供原出版物的信息,是读者见识数字图书馆“庐山真面目”的工具。由于技术积累和其他因素的影响,各家数字图书馆的阅读器差别很大。

  在数字图书馆软件系统平台的建设方面,还必须考虑的一个问题是数字图书馆与图书馆自动化系统的兼容问题,以及数字图书馆的易用性问题。


  数据库资源建设


  数据库资源建设是数字图书馆建设的核心工作。通俗地讲,如何选择性能价格比最高的数据库资源对于数字图书馆建设的成败至关重要。

  数据库资源的建设,可以从下述几个方面着手考虑:

  1.资源的新旧程度

  资源越新,出版时间距现在越短,则该资源的使用价值越大。如果一个数字图书馆提供的资源都是未加选择的过时的资源,那么这样的数字图书馆的使用价值就大大降低了。

  2.资源的学科建设是否完善

  根据每年文献出版情况以及版权建设进展情况,各学科要尽可能做到分布均衡,子学科覆盖面广,从而才能适应各个学科和大多数用户的需求。

  3.资源的学术质量是否很高

  只有把那些学术质量高,对教学科研、经济建设、社会发展有重要价值的资源收录进来的数字图书馆产品才能够更好地满足用户和读者的需要。

  4.资源是否是全息的

  所谓全息有三层含义:第一层含义是指全部的信息,包括资料的版式版面信息、文字、图像和色彩等;第二层含义是可以进行包括全文检索、分类检索、目录检索在内的各种各样的检索功能;第三层含义是可以进行文本摘录。全息格式是数字图书馆数据库资源的主流格式。

  5.资源所占空间如何

  资源占用的空间直接影响着数字图书馆的投入和未来发展。占用空间越大,投入越大,未来发展的负担越大。

  6.资源是否可持续发展

  所谓可持续发展,主要指与著作权人的合作是否是可持续的,取得授权的出版资源是否足够保证数字图书馆建设的持续进行。

  7.是否有复本的限制

  数字图书馆最大的特点就是没有复本的概念,如果存在复本数量的限制,就不是真正的数字图书馆。

  经过上述考察之后,就可根据本单位的具体情况选择有关专题库,然后安装在准备好的磁盘阵列之中。


  自动化系统的建设


  图书馆自动化系统是数字图书馆的一个重要组成部分,而且图书馆自动化系统在图书情报领域的应用大大早于数字图书馆。对于那些还没有配备图书馆自动化系统的单位,在建设数字图书馆时,最好同时将图书馆自动化系统配备好。这样,可以综合考虑两个系统的接口和兼容问题,从而方便管理和维护,更方便读者使用。


  面向读者的推广应用


  数字图书馆最终是面向读者、面向应用的,解决与应用密切相关的问题至关重要。数字图书馆建成之后,要根据情况不断地进行推广应用,使数字图书馆的建设投资获得良好的回报。




  建立数字图书馆应该注意的问题


  1. 避免只重视硬件而忽视数据库资源建设

  数字图书馆的核心是数据库资源和基于数据库资源提供的应用。单纯的硬件是构不成数字图书馆的。

  2. 数字图书馆数据库资源的版权建设

  版权、技术和标准是数字图书馆发展过程中的三大关键问题。版权建设关系到数字图书馆建设的长久、稳定及持续发展。

  3. 数字图书馆建设技术的采用

  数字图书馆核心技术经过了三次大的进步:第一次是计算机字处理和桌面排版软件的出现,使得小批量的信息数字化成为现实;第二次是扫描技术和光存储介质的出现,使得大批量印刷版文献能被计算机处理;第三次是全息数字化技术的出现和应用,它全面继承了第一次技术进步和第二次技术进步的特点,成为数字图书馆的主流技术。

  4. 数字图书馆的标准化建设

  标准问题是影响数字图书馆发展的关键性问题之一。标准化是数字图书馆发展的必然趋势,它可以促进信息资源的整合,实现异构数据库的兼容,降低数字图书馆建设的成本,促进数字图书馆事业的不断发展。

  5. 是否提供了比较完善的数字图书馆整体化解决方案

  完善的数字图书馆解决方案包括制作系统、发布系统、应用平台、网站管理系统、全文检索系统、阅读器和广播系统等。

  6. 占用空间是否合适

  数字图书馆是海量数据库,其占用空间不能太大,否则对于将来的发展很不利。一般地,一本300页32开的图书占用的空间在1M~4M之间。

  7. 是否代表了数字图书馆的最新发展方向

  所收录的图书是否是最近出版的新书,是否取得出版社的授权,是否用全息数字化技术加工制作,是否具有书内四级目录导航,是否提供基于ISO-2709标准的CN-MARC数据,是否与图书馆自动化系统有良好的兼容等等。

  8. 是否获得读者和用户的高度认可

  用户和读者是最有发言权的,用户和读者的认可是非常重要的。

  9. 能否吸收和借鉴相关领域的最新成果

  数字图书馆是一个综合性的学科,需要不断吸收和借鉴相关领域的最新发展成果,以促进自己的不断发展。知识管理和竞争情报在数字图书馆实践中的应用,现在已经初露端倪,并即将成为数字图书馆理论研究和实践发展的下一个热点。