
| 出版日期:2002-05-20 总期号:1118 本年期号:35 |
|
大百科:一路行进一路歌
郭莹 1978年,中国大百科全书出版社开始筹建。1993年,15年过去了,两万多人精心编纂的《中国大百科全书》出版面世,共1.3亿字、8万多条目、74卷。 现在,大百科人正在与方正合作,利用信息手段提高自己再版的效率,丰富出版形式。他们说,目前需要资料的读者已经可以上网查询。而到2004年以后,大百科全书出版社就有实力每年出一套再版《中国大百科全书》奉献给社会,可以让有需求的读者阅读电子书、光盘版,甚至可以让读者选择自己喜欢的章节单独印刷。 这一切,都是大百科人信息化探索的功劳,他们从1992年开始摸索,到现在已经进行到第三期,而且未来还要不断进行下去,同时也是他们高唱“百科精神”一路行进的成果。 1992年,百科全书编纂工作已进入尾声,百科人开始考虑后续的工作。他们想利用计算机技术进行数据资料的管理,建立百科术语数据库,以便再版时提高编纂效率,更可以为众多读者提供检索、查询服务。他们的想法得到了上级主管单位的支持。因此,在加拿大参观考察过先进出版方式的上级领导指示,要用信息技术武装中国大百科全书出版社,将书中全部内容做成数据库,并且要建成新闻出版行业的示范工程。基于这个目的,百科术语中心正式组建,王渝丽、田野是中心的负责人。 一期:良好的基础 田野拿出了两页的项目需求书,开始着手进行百科术语数据库(简称大百科数据库)建设的前期工作,而这项工作从一开始就受到众多领导和专家的关注。当时最主要的问题是编码,有两方面的工作,一是编码要规范,符合国际标准;二是书中出现的同一地名、人名、组织机构等,特别是译名,必须使用同样的词。 田野和他的同事从一开始就意识到将来的数据库必须符合国际标准,必须能够和国际接轨,才能不断地补充、完善、发展。他们做了很多前期准备,先是请了编纂《中国大百科全书》的各行各业的专家,尤其是计算机领域和标准化领域的专家,这些专家热情地把最先进、最及时的标准信息反馈给他们,帮助他们建立规范的数据库。说起这点,王渝丽眼圈红了,“很多老专家已经作古,没能看到我们现在的样子,但是我们的感谢会永远存在心里。”
中国百科术语数据库科研项目得到了各位专家的认可 1994年底,百科术语数据库项目正式立项。通过公开招标,1995年,大百科选择了在国内出版行业最具实力的方正电子公司作为合作伙伴。当时的方正电子已经牢牢把握住报纸印刷信息化进程,但是还没有完全进入图书出版行业,方正电子数字出版事业部产品经理苏静回忆起当时的情况说,“因为《中国大百科全书》内容庞杂,数据量大,而且生僻字较多,对我们的考验很大。也正是由于和大百科的合作,我们从较高的起点进入到了图书出版行业。”大百科现在主管科技工作的副总编龚莉则说:“选择好的合作伙伴是成功的开始,首先要看技术实力,还要看科研意识,我们和方正共同成长,才有了今天的三期式程。” 合作的结果是,以前大百科自建的库结构保留了下来,而且一直沿用到现在。方正电子负责数据库的具体建立和数据的导入工作,而大百科负责数据准备。 在王渝丽和田野的带领下,术语中心的同志们将大百科过去的条目,一条条地录入到数据库中。因为书中有很多生僻字,不在GB2312范围之内,他们又把这些字单独做成卡片,统计出词频提供给方正电子分别处理。由于技术限制,当时的处理方法很简单——做成图,但是,就这一点,已经让双方都疲惫不堪。 龚莉笑称最大的收获是培养了一个专家,也就是现在百科术语中心的副主任王煜。她原来是一个普通的学中文的编辑,经过编码设计的培训,代表新闻出版署参加了国际表义文字工作组,将大百科很多字都带入到了国际标准中,为中华古老文字“抢”到了不少位置。 当时的花絮是,加班的人经常在阜成门桥头的一家面馆凑合吃碗牛肉面,后来王渝丽为了给大家改善,晚上下班以后回家做饭,8点多再端着热乎乎的饭菜回来给他们吃。有一回,抱病工作的王煜还喝到了香甜的大米粥。 不间断的整理工作持续了一年。因为《中国大百科全书》是权威工具书,必须保证正确无误,在经过8次校对之后,库建成了,数据入库了。可是,用又来了问题。 数据库中含有所有《中国大百科全书》的内容,使用者可以从数据库中调用条目进行改变。另外,里面也有各种分类库,术语库、名人库、图片库等,编辑同样可以分类查询检索。可是,使用者真的会用吗? 为了普及数据库的使用,术语中心组织了12期培训班,对全社编辑进行培训从最简单的开关机、认键盘开始,到如何查询、修改,所有的编辑都必须通过考核。有些年纪大的编辑一时接受不了,但是随着时间的推移,慢慢也开始使用,大大提高了效率。
方正和百科人的合作精神是项目成功的保障 龚莉一直认为,这些都是意识问题。因为不重视,各编室都没有积极组织。以数据来源为例,随着《中国大百科全书》的修订,数据库也要不断更新,特别是图片库,前后有30多万张图片,但是编辑却很少主动把新的图片归入库中,导致资源没有共享。社里发现了这个问题,发文件,跟各编室开会讲重要性,并且开了一些数据库方面的课程,让大家逐渐意识到要转变观念,让资源最大范围地共享。现在,他们都主动将所有资料入库,并且很好地归类。这一过程是痛苦的,很多人都出现了情绪波动和一定的抵触情绪。社里采取了一定的措施,考试和奖励并行,开设各种培训班,在不太长的时间内进行了普及。 一期工程1997年作为我国第一个出版行业综合性数据库进行验收。1998年被新闻出版署评为科技进步一等奖,1999年被科技部评为国家科技进步二等奖。 二期:服务社会 《中国大百科全书》数据库有了,怎么样才能让更多的读者查询自己想要的资料? 1999年底,大百科全书出版社信息化二期工程拉开序幕,主题是网站。包括电子售书、信息查询等多项内容,合作伙伴还是方正电子。 因为有了第一期的数据库基础,网站搭建并不困难,真正的难点仍然是内容和形式问题。
三期工程出版流程整合图 要电子售书,要求各编辑必须提供自己所编纂的书的简介、主要内容及精彩片断,总编室负责监督、整理。刚开始,编辑都没有这种意识,经常是书出完了就算完成任务。通过总编室的催促,现在基本能够积极配合,将书的内容尽快上网,促进销售。现在,出版社专门有两个人负责网上订单的处理工作,他们不仅把读者要求订阅的书及时寄出,还将汇总情况按时反馈给各编辑,以利于他们下一步的选题工作。目前,这项工作已经实现了盈利,这或许是电子商务的简单成功演示吧。 网站的维护是需要费用的,大百科出版社的原则是,网站是一个服务性的部门,尤其是《中国大百科全书》,更要本着为社会服务的精神,不以盈利为目的。为了让费用与收入持平,《中国大百科全书》的网上查阅采取了会员制,先免费让人查询三次,如果再查,需要按照查阅次数进行缴费,以维持网站的运营成本。现在,很多出版社都与他们签约。 经过陆续添加,现在库里有《中国大百科全书》、《儒学百科》、《集邮百科》等多种书籍,每个都是单独的库,检索可以跨库进行。第一期工程完成时,库中是8万条信息,现在数据量已经达到100万条。 二期工程于2000年底验收,领导、专家赞不绝口。 三期:资源重组 2001年底,二期工程经过一年的维护与运行,经过一年深思熟虑的中国大百科全书出版社与方正电子开始了三期工程——中国百科术语数据库跨介质出版制作发布系统及学术著作网络出版发布系统。 龚莉的设想是,到今年年底工程完工,社里所有的书都可以以纸质、光盘、电子书的形式出版,甚至读者可以挑选自己喜欢的章节单独出版,提供个性化服务。
获奖证书是对大百科全书出版社信息化的肯定 更为创新的是,由社长田胜立亲自挂帅,大百科要建学术著作出版发布平台,满足现在很多作者希望出版自己专著的需求。以前有作者想出书,运作方法是抽取出版社自设的基金或者找企业支持,这回借着三期工程,完成发布系统,解决科技出版难的问题。作者将自己的论文提交到网上,提交到他偏向的出版社,出版社如果认为可以出书,就与作者谈。如果不出书,则只在网上发布,进行宣传。另外,网上发布后,只要有读者需要,出版社可以结集出版甚至按需印刷。 有经验的田野,这回给方正电子数字出版事业部开发经理何利军提交了两百页的项目需求书。 到今年年底,三期工程就要接受验收了,龚莉说,这只是社里信息化建设的前几步,以后还会向出版管理信息化等方面迈进。 年轻的权威 中国大百科全书出版社(http://www.ecph.com.cn/)于1978年11月18日正式成立,20多年来,已发展成为以出版百科全书和其他工具书为主,同时出版各种学术著作和普及读物的国家级大型出版社。 改革开放为中国的百科全书事业带来了勃勃生机。20多年来,百科人肩负重托,顺应时代的要求,先后出版了《中国大百科全书》(74卷)、《中国大百科全书(简明版)》(12卷)、《不列颠百科全书(国际中文版)》(20卷)、《中国百科大辞典》(10卷)等一系列鸿篇巨制,出版各类专业和地区百科全书50余种,出版各种系列工具书、普及读物3000余种,出版电子出版物和音像制品100余种,此外还编辑出版了《百科知识》、《电脑校园》和《小百科》三种杂志。1993年以来,先后有180余种图书获得国家图书奖、国家辞书奖、中国图书奖等国家级大奖。 出版社拥有编辑、出版人员近200人,编辑人员所拥有的专业知识几乎覆盖了现代科学文化的所有领域,拥有设备先进的电脑编辑区、藏书丰富的图书馆、技术雄厚的百科术语中心、连锁经营的百科书店,各种辅助设施齐全,能为编辑、出版、发行工作提供全方位的服务。 大百科三期工程介绍 大百科信息化三期工程与北大方正电子有限公司合作,于2001年12月开始需求分析,已经过概要设计、详细设计阶段,2002年4月28日正式进入编码阶段,预计在今年9月可以投入试运行。 对中国大百科全书出版社这样的大型辞书类出版社,三期项目的顺利实施将完全改变传统落后的手工编辑出版方式,减少重复手工劳动,减少错误,大大提高工作效率、缩短出版周期。特别是可以方便地出版多种介质的图书(如纸介质版、电子书版、光盘版和网络版),这也将是出版业的一个不可忽视的新的经济增长点。三期工程的建立还将对其他出版业同行起到示范作用,其成果也易于向其他新闻、出版单位推广。中国百科术语数据库进入因特网对外发布,为公众提供全方位的百科全书服务,必将改善因特网上中文信息少的状况,积极推动出版行业在因特网上的发展,对我国信息现代化也将起到促进作用。 由于《中国大百科全书》内容的特殊性,支持GBK编码的所有国内外厂商的系统都不能满足应用的需要。经与方正电子多个部门的通力合作,系统选用最新国际标准GB18030-2000方案,所有的应用支持GB18030标准,这包括数据库、书版编辑器、电子书制作、全文引擎等,是国内全面支持GB18030标准的大系统。 百科术语数据库数据库现有条目总量约100 万条,格式纷繁复杂,内容样样俱全,包含图片、表格、公式、方程式、化学分子式等等,同时还要考虑对新增多媒体数据的支持,如何表达、存储、排序、显示、出版都是一个非常复杂的问题。经过再三的分析讨论,系统采用了方正电子的XML信息标准,保证了系统数据的一致性、扩展性、连续性和开放性。 为达到一次加工多次引用,实现真正意义上的数据库跨介质出版,通过系统业务模型的反复修改调整,以及和大百科各部门工作人员的多次讨论,最终完全抛弃了一期、二期中条目资料管理的概念,将网站投稿、编审流程、条目标注、数据库存储、跨介质出版和网站销售融为一体,彻底理顺了大百科出版的业务流程,提高了出版的效率。 出版行业最关心的是版权问题,既要保证《中国大百科全书》足够的覆盖率,又要保证正式出版物的版权。采用方正电子的阿帕比产品和ASP服务器,解决了Ebook的出版、销售和结算业务,并保证了出版商的利益和作者的版权。 也谈态度 东软前一段时间提出,软件是一种态度。这里,我们说,信息化也需要态度,而且不同的角色态度也会不一样。 大百科全书出版社的信息化工作由几方面完成。一是方正电子。方正电子作为国内出版行业信息化的排头,上到王选教授,下到普通编程人员,都对项目非常重视和认真,苏静跟踪这个项目已经有四年,开发经理何利军时间更长,这就保证了他们对客户的了解程度,也保证了项目连续性。 二是很多知名的专家学者。他们从项目一开始就抱着关心的态度,开专家讨论会,提供最新的资料,讲解最新的技术,保证了项目行进的成功。 三是大百科的领导。他们拨出经费支持项目,当遇到困难时积极在政策上给予倾斜,要求项目组按时汇报,及时解决问题。 四是项目的主角,也就是百科术语中心的工作人员。在IT行业待遇普遍提高的今天,守着自己的本职工作,兢兢业业,不贪图待遇,以稳定的队伍完成了工作,也就是“百科精神”。 五是大百科的所有编辑。从刚开始的不理解,到后来的鼎立支持,献计献策,态度的转变反映了信息化工程的变迁。 他们说,这就是大百科精神,这就是他们前进时高歌的旋律。 这或许是要做信息化或者正在做信息化的企业,最应该学习的地方。 |
|||||||||||||||||||||||||||