|
打开文档,对于操作电脑的人来讲是非常简单和平常的事情。可是,你是否注意到每个文档都只能用对应的软件才能打开这个细节?要想提取、检索各种文档里的信息,就要正确解析不同类型文档的格式。也许,你对此已经习惯,不觉得这是一个需要有所改变的事情,但你肯定会承认:你也许不能编辑其他软件创建的文档,管理文档因此会变得麻烦。
你是否认为文档的访问控制权限只能分为权限、无权限两极?如果,你想让某个人只能在线读文档内容却不能下载拷贝该文档,或者让某个人只能看一个文档其中的一段,这些能实现吗?
答案是肯定的。UOML标准以其开放性改变了软件业长期以来各厂商文档格式各自为政的现状,使不同软件可以编辑同一文档,甚至是同一文档的同一页,实现了文档能够在不同软件之间共享、可交换、互操作的理想。
日前,中国计算机报社执行总编辑刘保华与中国电子工业标准化协会文档库技术标准工作委员会主任、书生公司董事长王东临,围绕UOML标准以及SEP文档库技术展开了对话。
打通文档互操作通路
收到无法打开的文件时你会怎么处理?找到相应软件来安装再打开。然而,世界上有多少种软件就有多少种不同格式的文档。在政府部门内,仅办公软件就存在国产Office软件和微软Office软件并存一处的局面。仅仅一类办公软件尚且如此,还不算地理信息文档格式、工程图纸文档格式、申报审批文档格式等等。
据有关部门调查统计,我国政府机关日常办公所涉及到的电子文档格式多达上百种。可以想象,这上百种格式之间无法实现互联互通会给政府办公以及政府与公众交流带来怎样的障碍。
刘保华:书生公司自1996年成立以来,一直致力于文档技术的研发与推广,并取得了很好的业绩。书生公司为什么会选择这个领域作为自己的战略发展方向?
王东临:我们很早就注意到,IT技术的普遍应用并没能改变“信息仍以纸张形式为主存在和使用”这一传统现实,昂贵的电脑常常只是被用于文档编辑,然后再把这些文件打印出来使用,电脑简直成了高级打字机的别名。我们认为这正是我们可以通过自主创新实现超越的机会。
由此,书生在诞生之初,就把“以数字技术取代纸张应用”作为我们的奋斗目标。十年来,我们从白手创业发展成了中国一流的IT企业,并成为中国在产业核心技术领域达到全球领先水平的软件企业之一,用成功的实践证明了我们的预见力和创新能力。未来十年,我们还要继续向这个目标迈进,进一步发展为世界一流的IT企业。
在我们的规划中,书生公司的使命就是用数字技术取代纸张应用,使越来越多的信息以数字的形式存在并使用,让信息流逐步取代纸张流成为工作、消费的主要载体。我们坚信当信息都纷纷摆脱纸张的束缚后,将为人类创造无与伦比的价值。
刘保华:书生公司在文档技术领域有什么样的发展历程?在何种程度上实现了书生公司的技术愿望?
王东临:书生公司以纸介信息的数字化技术为企业发展战略,在过去的十年间相继开发了三代SEP技术:SEP数字纸张技术、SEP智能文档技术和SEP文档库技术。这些技术使电子文档不仅具有数字技术的优点,还继承了传统纸张的特性,使像电子公文这样的高要求应用得以数字化。而最新的文档库技术则使文档的互操作成为可能,由书生公司等8家单位牵头制定的UOML标准将引发继数据库产业之后一个更大的产业群——文档库产业。
UOML标准为文档互操作提供了可行之路。今天,只要应用UOML标准,任何软件都能打开其他软件生成的文档并对其进行操作。像任何人都能看到别人写在纸上的内容并可继续在纸上写写画画一样,UOML通过开放标准实现了文档信息的互联互通,使文档信息流从此变得畅通无阻,并在技术层面上解决了只有依靠纸张才能解决文档互操作的难题,消除了电脑只当“高级打字机”用的技术障碍。
依托核心的SEP技术,书生公司的业务正在从国内机构用户市场向消费市场和国际市场拓展。书生是电子印章和电子公文的发明人,在政府与企业信息化领域声名卓著。目前,累计约数亿份政府公文和数十万本数字图书采用SEP技术,书生用户平均每秒钟收发15份电子公文,书生数字图书读者超过1000万人。
拯救无纸化办公
1998年,美国国会通过了《政府文书消除法案》。一时间,一股无纸化办公潮流在美国迅速兴起。曾经有人预言,不出多少年,纸张将被彻底扫下办公桌,代之以经济高效的数字化网络办公新模式。有人进行了大胆的预计,宣称这场史无前例的办公革命每年将从电锯下拯救出大量用于造纸的树木,从而为全球植被保护做出巨大的贡献。
然而,时隔多年,“无纸办公”这个网络时代的新生儿却未像人们所预期的那样茁壮成长,电子文件仍然难以战胜纸张这个神秘而古老的媒介。时至今日,“有纸办公”仍然是日常办公的主旋律。
刘保华:书生公司提出以数字技术取代纸张应用的理念并为此提出技术方案,那我们可以看一看无纸化办公的发展。其实,无纸化办公并没有很好地发展起来,书生公司作为技术方案提供商,对此有什么看法?
王东临:这其中的一个不容忽视的核心问题就是,由于文档格式千差万别所带来的文档信息不能互联互通的问题,使得原本应该能够节约大量资源的无纸化办公成为了一个昂贵的梦想。有三个因素需要注意到:
第一,文档不能像纸一样保持不变。你可能会遇到这样的情况:自己编辑得好好的文档发到对方那儿却变样了。其原因就在于办公软件的版本不同。但是如果只是页码变了还好说,如果是电子公文、合同等重要文件被篡改,那就是梦魇了。人们常常说的白纸黑字——版式固定、不可篡改、不可分割成为纸张的重要特性,如果做不到这些,那就是电子文档的潜在危险。
第二,文档不能像纸一样永久保存。在许多机构电子档案管理中明确规定:“具有永久、长期保存价值的电子文件,必须形成一份纸质文件归档”。绝大多数实行无纸化办公的企业仍然是双管齐下,电子、纸质同时运行。尽管无纸化公文传输使得办公效率大大提高,节约了一定的资源,但是由于电子文稿无法完全取代纸质文件,许多地方上传的文件仍然需要打印出来,盖章签字然后保存。
保存归根结底是为了再次利用。且不说硬件存储设备的变迁,软件的更新换代就足以让人们对电子文档失去信心。就拿档案管理来说,各种电子档案格式不同,如果某个办公软件的厂商倒闭,那么若干年后,使用该软件格式的档案将无法打开。所以档案管理部门每年都会投入一大笔资金用于数据抢救。
第三,文档不能像纸一样互联互通。无纸化保存存在着风险,连无纸化传输也十分尴尬。每个人的电脑里都装了大量的软件,即便如此,同样会经常收到你无法打开的文档。无纸化让企业不断地购买新的软件,这是一笔昂贵的支出。
最终导致无纸化失败的是无纸化编辑。某人精心准备了一份项目方案,但是他发现,文档中插入的图片变形并且不能编辑,表格功能简单,只能在图片和表格编辑软件中编辑完成后粘贴到文档中,并通过邮件发送。该文件需要经过各部门领导的层层审批才能完成它的流转。如何保证审核过程当中文件原文保持不变又能体现各位领导的批复内容?答案是打印成纸。至此,无纸化失败。
刘保华:面对这些问题, UOML标准和文档库技术将会如何推进无纸化办公的发展呢?
王东临:我认为,SEP核心技术能够解决无纸化办公的最大难题——信息的完整性和表现的方便性,也就是说,能够保证不可篡改性、版面一致性、不可分割性三大特点。同时基于该技术,不管是数字纸张的外观还是相关应用技术开发,都与原来接近,傻瓜式的操作能让人们从心理上更容易接受,甚至比原来更加方便。
在文档格式方面,文档格式能否实现统一呢?要想实现文档的互操作,必须绕过文档格式。就如同在数据库领域,系统开发软件通过统一的操作标准SQL来对各种数据库进行操作一样,文档编辑软件需要通过统一的操作标准来对各种不同格式的文档进行操作。这是一种革命性的思路。UOML标准的诞生使这种思路成为现实。
UOML从一推出就获得了市场的支持。目前,国内主流Office厂商,如中文2000、中标、共创开源、永中、金山等多方合作,全线支持UOML标准,国内软件不久将实现互联互通。像档案局这样处理大量不同格式文档的单位,不用担心某一种软件退出市场而面临数据丢失,因为通过统一的操作标准,任何支持这个标准的软件都可以打开这些文档,不必将所有档案打印保存。
但在这个全球化最强的行业里,要想获得最后的胜利,必须坚持开放,以国际游戏规则和国际惯例来行事。国际性标准组织OASIS对UOML的青睐,使得它将成为被各大跨国企业所认可的标准。事实标准的姿态将使得UOML迅速获得全球市场甚至垄断企业的认可。开放性的统一标准将打破格式垄断,实现互联互通,从而推动无纸化办公迅速发展。
特别值得一提的是,UOML标准从打造产业链和产业发展的角度提出了“以操作为标准”的发展思路,这对未来非结构化信息处理产业的发展具有革命性的影响。
占领高端市场
美国马萨诸塞州曾对OpenOffice应用情况进行了一次调查研究,结果发现在用OpenOffice软件打开文档时,超过300页的庞大文档居然会出现崩溃,并且无法修复。不过,当使用基于UOML标准开发的OpenOffice软件时,不仅可以保证OpenOffice文件100%的正确性,避免客户数据的丢失,还可以实现文档的互操作,如添加批注等。UOML标准在马萨诸塞州得到了认可。
刘保华:技术只有被市场认可才更加具有生命力。书生公司如何推进SEP文档库技术和UOML标准的市场推广?
王东临:我们主要在4个方面开展了推广工作。在产业界,我们推进其他产品对UOML标准的全面支持和深入合作,拓展新的用户需求和市场机会,用产品深入合作的成功来带动联盟成员的发展;在用户层面,我们进行多方面的标准宣传,用应用价值带动用户支持;在政府层面,我们积极推进政府对UOML标准的支持和采用。目前,信息产业部已经正式立项,加快UOML等文档库相关行业标准的制定步伐。同时,我们还加强了与行业协会合作推广的力度,并面向不同领域开展了相关培训。
刘保华:据了解,你比较重视在欧美市场的推广,这是为什么?如何占领欧美市场?
王东临:我确实非常重视欧美市场,今年我在国外出差的次数远远超过我在国内出差的次数。我认为IT业是全球化程度很高的行业。如果只做中国市场,也需要有全球竞争力;如果有全球竞争力,为何只做中国市场呢?书生公司研发SEP技术,其实是通过自主创新开辟了一片蓝海,在软件行业,只要占住了欧美市场,就拿下了天下,因此,书生一定要趁自己技术领先的时候占住高端市场。
在致力于开拓欧美市场的时候,我们将通过掌握领先技术、参与制定全球标准、掌握技术专利以及在国外寻找合作伙伴进行宣传推广等步骤,逐步提高在国际市场的市场份额,并把“书生”打造成全球品牌。
9月28日,《中国计算机报》执行总编刘保华与书生公司董事长王东临围绕UOML标准及SEP文档库技术展开了对话。
UOML标准及SEP文档库技术
UOML标准
UOML的全称是 Unstructured Operation Markup Language。通过对书面文档的描述抽象,UOML定义了一种具有普遍代表性的文档操作语言。应用程序通过调用UOML就可以实现与文档有关的操作,包括文档组织、版面描述、信息安全等。
UOML采用XML表示,具有极强的通用性和开放性。通过UOML标准统一面向书面文档处理的操作接口,可以很好地解决目前书面文档处理过程中出现的书面文档技术平台不统一、文档格式不一致、访问接口千差万别等瓶颈问题。
支持UOML的软件可以实现文档可交换,即一个软件生成的文档可以用另一个软件继续编辑,而且可以完全自如地控制其他软件生成文档的显示界面。
SEP文档库技术
SEP文档库(DocBase)技术是对书面文档进行描述、存储、处理、管理的基础技术平台,通过公开规范的非结构化操作标记语言,统一面向书面文档处理的访问标准,为应用软件提供书面文档的通用操作功能。
构建文档操作的自由王国
在接受采访时,王东临表示技术的进步能让人们完全像使用纸张那样随心所欲地操作电脑文档。人们不用再去考虑文档是否不可更改、是否产生遗漏等问题。技术完全能满足人们的使用习惯,人们不必被动地适应各种不同的文档格式要求。
书生公司给出了技术解决方案。该公司的文档库技术以版面为切入点,超越不同的文档格式,在实际应用层面推进不同格式文档之间的互联互通与互操作,带来了文档应用的新选择。
王东临显然并没有满足于单纯的技术研发,而是高举标准开放的旗帜,倡导建立UOML标准。“UOML标准绝对不是书生公司自家的标准,而是业界共同的开放的标准,书生公司只是希望能在这个领域里面有所作为,哪怕只是占一点点的市场份额。”王东临如是说。
只有想不到,没有做不到。对于书生公司文档库技术的研发与推广来说,这句话非常合适。曾经对国际跨国巨头们充满了敬畏之感的王东临,现在想的是占领欧美高端市场,把书生公司发展成为全球品牌。他的努力得到了回报。今年2月份,国际标准联盟组织OASIS宣布成立UOML技术委员会,这是第一个在OASIS内部由中国软件产业主导成立的标准委员会,为UOML成为世界标准奠定了良好基础。
不仅如此,由书生公司倡导建立的UOML联盟在国内已有近50家公司加盟,并有若干家公司开始采用UOML标准。Sun、IBM、富士通等公司也已开始关注和支持UOML标准。
UOML标准势头正好!也许,不久的未来我们可以像使用纸张那样操作电脑文档,而UOML就是支撑这一自由王国的标准。
|