ccidnet????

出版日期:2004-07-05 总期号:1327 本年期号:48

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
产品与应用
渠道与市场
华东专刊
华南专刊
西北专刊
西南专刊
方正电子:新公文、新战略



  谈到电子出版、无纸化与智能化,对于方正来说,是一些相互关联的技术或方向,在需求上,它们满足社会不断发展所产生的不同需要;在技术上,又彼此关联,互为依托。

  “告别铅与火,迎来光与电”这句话概括总结了方正在文字处理领域最初的成就。北大王选教授发明的方正激光照排技术,从1974年8月开始到如今,正好是30年头。当初周恩来总理曾亲自关注的一个项目,如今已经获得了20多项国际国内专利,两次获国家科技进步一等奖、两次被评为中国十大科技成就奖。

  方正技术的发展和现代出版业密切相关,中国出版社、期刊、报纸几乎都在使用方正照排,并且也带动了办公领域的发展。目前正式公文的排版印刷也几乎都在使用北大方正的中文出版系统。

  如今,在电子出版技术方面,方正已经跻身国际先进行列,与Adobe,Global Graphics一起,成为国际上能提供专业栅格图像处理器(RIP,激光照排核心控件)的三家厂商之一,高速PostScript/PDF 解释技术、硬件接口与驱动技术、彩色管理技术、多种的图像挂网技术、网络连接技术、可变数据解释技术等关键技术都居世界前列,产品已经在欧美占有一定市场份额。

  在版面处理技术方面,方正书版软件、飞腾软件、S2文件格式,在国内专业出版领域使用普遍,甚至由于软件普及度非常高,中央及地方很多政府在传送电子文件时,都采用了方正版式的格式,从而影响了一批相关软件。方正从1996年开始研究SGML与XML,目前,已经开发了基于XML的文字编辑系统,在报社得到了良好应用。

  在不断提升印刷出版质量和效率的同时,方正也不断拓展新技术、新方向,与无纸化相关的两大技术:CEB与XML就是代表。CEB是一种版式文件格式,保持原版原式、防篡改、支持多媒体;提供多种安全保护手段,适合处理中文及少数民族文字,并已广泛应用在出版和办公领域,获得普遍认可,是方正30年文字处理技术的结晶。数字权益管理 DRM(Digital Rights Management)技术核心是防扩散,研究如何保证电子文档是从甲传到乙,并能控制它不传出去等。2003 获得信息产业最高荣誉“国家重大技术发明项目”,是保护出版物版权、保障电子公章安全的基础技术。

  依靠这两项技术,方正为出版单位提供了网络出版的解决方案和合理的权益保护方案,因此,建成了全球最大的单一正版电子图书库,并且,中国第一家电子报纸也将在年内采用方正技术全球发行。

  方正的这些技术,也得到政府的认可与支持,从中央到很多部门及地方政府,都采用了CEB作为版式文件。在2002年全国政府办公厅文印工作会议上,CEB被确定为“推荐标准”供大家选用。

  随着网络出版及电子公文应用与技术的发展,方正看到把纸变成电子,仅仅是应用的第一步,要满足互联互通、信息共享;要实现过程自动化、提高工作效率仅仅有版式信息是不够的,并且在现实中,已经产生了一些困扰,如很多现有公文数据是按文本格式存储在数据库中,不能自动生成版式,如果转成html或xml,显示的一致性又不好。另外,机器很难对版式进行分析,不能理解文件内容,所以无法自动处理,需要人工干预和判断。此外,不能把内容与形式分开,信息统计和分析困难,降低了再利用价值。由于仅有版式,存在以上及其它一些问题,方正提出了智能文档战略和技术方案。

  方正对智能文档的定义是:具有语义信息的跨媒体版式文件。它由三层结构组成:

  表现层——提供类似于纸张的外观表现,同时可以支持多媒体信息,使读者在获得传统使用感受的同时,获得更强的信息。

  语义层——是对文档内容之间逻辑结构的描述,通过对语义的理解,可以实现对特定数据的操作和数据之间的自动交换。

  应用层——对数据的各种操作,如传输、格式转换、数据交换等提供接口,方便各种应用对数据的利用。

  所谓语义,是指文档各组成要素(对象)之间的关系。早在上个世纪九十年代以前,智能文档就被赋予了语义概念。6年前,万维网发明者、英国著名科学家蒂姆·伯纳斯,提出“语义网络”的理念,并致力于推广OWL(Web Ontology Language),一种为应用提供的内容处理语言,在2004年2月成为W3C的推荐标准。至此,美国政府也开始重视语义技术的发展,2003年9月,在白宫专门举行了Semantic technologies for e-government会议。

  语义信息与版式信息的结合,使智能文档具有以下特点:

  1.可以原版原式展现丰富的原文原貌。无论原来版面是什么类型,包含什么特殊文字、图形、图像格式,版式多复杂,都可以真实地再现原貌。

  2.安全可控,是可进行数字签名、加密的文档。可以对文档内容进行数字签名和数字加密,并提供相应接口,可以选择不同的加密方法和加密设备。

  3.带可扩展的元数据信息。元数据和文档保存在一起,可以记录文档在起草、流转过程中产生的各种信息,保存文档的来龙去脉。并且,通过文档中的元数据,使文档在使用过程中能够被自动处理。

  4.支持交互与动态特性。文档可以和人,也可以和数据库、其它文档等进行交互,使文档能够根据环境进行及时变化,始终反映阅读者希望的状况。

  5.可以自动计算、校验等。可以根据预先的设定,对文档中的内容自动计算或检查。

  6.可以被计算机理解,可再利用。通过语义信息,计算机程序就可以对智能文档进行判断、分类、路由或其它操作,提高文档的使用效率。

  在方正智能文档中,采用XML表示语义信息,整体框架如图1。

  方正智能文档方案主要由四部分组成:

  1.客户端应用程序:由一系列工具软件组成,为文档生命周期的各个阶段(创建、显现、交换、办理、归档)提供功能支持。

  2.智能文档CEB:包含版式信息和XML语义信息,是数据文件的保存格式。

  3.应用服务:是服务器端软件,在数据库基础上,提供格式转换、数据保护、存储和检索等功能。

  4.安全保密通道:安全保密通道采用密码技术和数字权益管理技术,保护交换、利用和存储过程中的数据安全。

  在整体框架下,方正根据文档从起草到归档整个生命周期不同阶段提供了相应产品如图2。

  如万能转换器、标准公文生成器、CEB Reader、智能表单系统、领导手写批示系统、电子公章管理系统、电子公文交换系统、电子文档管理与发布系统、重要文档防扩散系统。

  方正智能文档的应用,能提高文档处理过程的自动化程度,顺畅各系统各应用之间的连接,提高信息共享程度,进而提高工作效率。

  在现有的应用系统开发中,相关联的系统往往会比较多,广州市政府政务信息化中心主任刘泉宝博士谈到公文交换系统选型中提到,交换系统在使用中至少和以下四种系统发生关系:a交换系统和公章中心;b交换系统与各单位OA系统c交换系统与内部门户网站;d交换系统与其它交换系统。在各种系统之间,应该可以平滑连接,如交换系统应该可以嵌入到OA系统中;用户登录进门户网站,如果有权限,进入交换系统时就不需要登录并知道自己已经进入交换系统等,从而最大限度实现处理过程自动化。要满足广州市政府的要求,文档格式除了能统一多种文档格式为一种可交换版式外,还需要支持一些基本的语义信息,以适应不同系统之间连接的需要。方正CEB满足了这方面需求,从今年3月开始,已经随广州公文交换系统的正式运行成为政府的基本文件交换格式。

  随着智能文档的应用普及与深化,人们对文档的处理,更多地将依靠自动化手段完成,由于有了语义信息,数据共享和检索将更方便,不仅可以提供通常数字文档的全文检索,还可以提供文档之间内容的关联检索。一份文档,也可以更好地满足屏幕显示、办公室打印、工厂印刷和档案馆存档这样不同的需求。国外一些公司提出,文档智能化最终将实现,在第一时间以正确的形式传递正确的信息给正确的人。这体现人们对信息及时性、有效性和准确性的要求。方正在文档处理技术方面,也将不断深化智能文档和其它技术,以满足中国信息化建设的实际需要。