首页 | 旧版 |中国计算机报 |中国电子报 |通信产业报 |计算机用户 |电脑教育报 |软件世界 |数字时代
高级检索
读者之窗 | 新闻评论 | 眼界 | 管理 | 调查 | 案例
封面故事 | 采购与实施 | 行业 | 产业 | 专栏 |  
第17期 总第708期
浏览往期
当前位置:首页>>赛迪媒体>计算机用户>行业
UOML标准,打开格式围墙缺口
作者:UOML联盟秘书长 刘明娟 

文档格式的“诸侯割据”对多数人来说已经见惯不怪。但这种现状对实现信息的共享和利用带来了巨大的阻碍,进而影响了文档信息产业的发展。

UOML标准横亘在内容管理软件企业面前的格式围墙上打开了缺口,原来分散、零碎的文档之间,可以实现互联互通。

对于一般用户而言,电脑里面装有Word、Excel、Powerpoint、Photoshop这些软件基本就够用了。但是,谁也很难保证,有一天会不会收到WPS的文档,如果没有安装这种软件,就根本不可能打开这些文件了。但若仅为这几个文件而购买、安装正版软件的话,付出与所得根本不成正比。

UOML标准的功能图

文档现状:诸侯割据

尽管文档格式的“诸侯割据”,对绝大多数人来说已经见惯不怪。但这种现状对实现信息共享和利用带来了巨大的阻碍,进而影响了文档信息产业的发展。

在数据库应用领域,全球已经形成了每年150亿美元的市场,像IBM、微软、Oracle、Sybase等世界巨头,已经成为全球软件业的骨干。而这样巨大的市场规模的基础——结构化信息——只占了整个信息世界的20%,而占据信息世界80%的非结构化信息领域,却没能形成如此强大的产业链。

对此,业内有不少专家认为,其阻碍主要来自于文档信息世界的割裂。

如此之现状,令TRS这样的内容管理企业深感头痛:面对市场上300多种常用的文档格式,如何从这些文档中提取信息,以便对各种文档内容进行管理,成为了一座难以逾越的“鸿沟”。

相比之下,我们不难发现,不少企业站在关系型数据库的肩膀上,成功地开拓了一片生存空间。大多数管理软件企业自身并不拥有数据库技术,但他们同样在这一领域获得了发展机会。像用友、金蝶等软件公司,他们之所以有机会在应用市场上站住脚跟,并发展到相当的规模,在很大程度上,得益于结构化数据库的标准化,使他们不必关注于底层数据库技术,而只专注于应用的功能性开发。

然而,在文档领域,情况就不同了。包括WPS、中文2000等在内的一大批文档软件产品,所面临的尚未完全摆脱的生存困境,以及为了软件产业一致发展的目标,迫使IT产业急需找到一条新的有效途径,来打破这种文档的“自治”。

UOML联盟:打破格式围墙

在“诸侯割据”的境况之下,针对非结构化信息处理而诞生的UOML标准,在横亘在内容管理软件企业面前的格式围墙上,打开了缺口,原来分散、零碎的文档之间,可以实现互联互通。

之前,针对传统的文档互操作问题,曾经出现过这样一条解决思路:用一种复杂的文档格式作为标准,让各种文档软件以此为标准进行应用开发。但是,这种思路基本没有实现的可能性。每家文档软件企业,都不认同这种方式,标准即使制订了,没人支持也只能是空谈。

UOML联盟采取的原则是一种完全不同的策略:绕过文档格式的束缚,推行一种文档操作标准。用户只需要简单调用,就可以对所有符合这种操作标准的文档进行操作。

显而易见,这种思想与关系型数据库体系有异曲同工之处:结构化信息以SQL定义了一系列数据库操作,可以对所有关系型数据库中的信息进行操作。这不但奠定了数据库广泛应用的基础,连带也盘活了一些中小型的应用软件企业。

事实上,UOML标准称为非结构化文档操作语言,是一种类似于SQL的操作标准。由书生公司推出的SEP文档库是全球第一个文档库技术,是UOML标准的第一个实现。软件通过调用UOML,来操作符合SEP文档库定义的数学模型的所有文档,使文档应用开发和数据库应用开发一样简单、高效。

也就是说,在文档应用体系中,在文档和功能性应用之间,用SEP文档库技术进行隔离,形成文档应用的中间件技术,以UOML标准为连接,从而使文档软件摆脱文档格式对应用的限制。如此,软件企业可以避免开发上的繁杂情况,而只需要专注于功能性的开发,节省大量开发成本。

同时,对于终端用户来说,只要使用的软件中是支持UOML的,就无需再安装其他多种类型的软件,也可以进行各种操作。这就从软件的操作层面,实现了全应用链的互联互通。

从产业发展来看,UOML的终极目标,实际上就在于串连起一条各企业之间分工细化、协作发展的文档信息产业链。实现软件互操作,不过是其实现目标的第一步。

由于UOML对推进非结构化信息处理行业的发展,有着实际应用意义,UOML联盟刚成立,就引起了相关企业的强烈关注。从成立至今,已经有神州数码、紫光启明、中文2000、汉王科技、中标软件、共创开源、TRS、书生等近20家文档应用相关企业加盟。

鉴于SEP文档库技术是UOML的第一个实现,为了推动UOML应用,书生公司将为联盟内企业永久性免费提供SEP文档库技术核心版本的支持,来共同促进文档信息互联互通的实现和发展。也就是说,联盟成员企业的软件产品,可以通过支持UOML来调用文档库,从而轻易地操作其他任何一个成员软件产品生成的文档。

一个最基本的理解是,用户购买其中的任何一款软件产品后,不用再为打开其他联盟成员软件生成的文档而再安装其他软件。

当然,UOML的影响不仅限于这种简单的文档应用,像TRS这些企业,在对文档信息进行管理时,原来的管理难度也将成为历史。

一个典型的文档应用中,从文档的生成、签名、审批、存档、检索管理,原来涉及的不同软件,几乎不可能对同一文档进行操作,而SEP文档库解决了这一问题。

从技术人员的演示中可以看到,一份邀请函从工作人员拟定,邀请人附上电子名片,受邀方工作人员签署意见,受邀人手写签署同意与否到最终存档检索,其间被多个不同的软件打开、显示、内容修改和存档检索,这在过去的应用模式下是不可能实现的,而支持UOML标准的SEP文档库,完成了这种文档应用的流程需求。

新标准改变产业链

正如前面所提到的关系型数据库及SQL的形成,为结构化信息产业发展和中小企业发展奠定了基础一样,UOML所影响的不仅仅是一些企业,而是一个产业链,这就使其必然成为文档应用软件企业发展的基础。

在大多数公众眼里,文档应用等同于文档处理软件应用。但是,这种理解正如多数网民不知道网站背后数据库的重要性一样,文档处理只是文档应用中面向普通用户的一个侧面,它还涉及到企业信息管理的方方面面。因此,它也就不可避免地影响到文档管理相关的各种企业,如文档数字化、文档处理、文档管理等一系列软件企业。

这意味着,并不仅仅是文字处理软件,所有需要与文档打交道的软件应用,都可能因为UOML的应用而发生改变。

根据企业在应用方面专注方向的不同,UOML联盟为产业链中的五类企业—文档信息采集类企业、文档信息编辑类企业、文档信息应用类企业、文档信息管理类企业及系统集成应用类企业,提供了不同的支持方案。方案中,除了提供免费的文档库技术开发包及其技术支持之外,还提供了相关的产品及应用推广方面的支持。

尽管各类方案的出发点不同,但实施的结果,都体现出了文档库技术及UOML标准存在的价值。

首先,各类企业支持UOML标准软件的研发工作,一般一人一周即能完成。

其次,对UOML的支持,可使企业降低开发难度、维护成本、应用风险,提高适应性,达到不同软件之间的高度互通和共享,从而提升在业内的竞争能力,最终达到合作与发展的目的。同时这也是文档库技术最基本的目标和出发点。

就UOML对文档信息产业链的影响而言,它不但将使文档信息产业链的社会化分工成为可能,还将为更多的中小企业,降低进入市场的门槛,发挥某个方面的专业优势,赢得发展机会。

未来将是一个开放性的数字信息时代,封闭的、不能互联互通的数字信息,不再符合时代的需要,尤其是在信息世界中占80%的非结构化信息,对其处理的需求具有巨大的发展空间。因此,针对其进行处理的技术,自然是未来的核心技术。

中国软件企业“先得月”

由于一项新技术的价值发挥在于将其产业化,形成一条以互联互通、分工合作为基础的产业链,将极大地推动中国软件企业的共同发展。

当年Oracle就是借助关系型数据库及SQL的兴起,抓住产业发展趋势一举成为全球软件产业第二大软件公司的。那么对于中国软件行业来说,UOML诞生在中国,全球首个文档库技术SEP也诞生在中国,因而中国软件企业具有“近水楼台”的契机和优势。只要越来越多的企业都愿意加入到支持UOML的队伍中来,由中国的软件产业支撑起类似Oracle这样的的软件公司将指日可待!

■ UOML联盟

UOML(Unstructured Operation Markup Language,非结构化操作标记语言)联盟是由遵守UOML标准的企业、机构、组织、个人自愿组成的全球范围的联合体,旨在通过开放的标准实现文档的互操作,在软件业历史上第一次实现不同软件都可以对同一个文档进行操作,解决不同软件生成的文档数据互不兼容问题,消除因为文档格式不同而造成的信息孤岛。

UOML是基于XML、跨平台、与编程语言无关、与具体应用无关、定义了非结构化文档操作通用功能的开放标准,使用UOML可以实现文档库、文档集、文档、页、层、文字、图形、图像、字库、印章、元数据、导航、导读、超链接、插件的创建、编辑、检索和信息提取,并提供存储安全、角色管理、访问控制、签名认证、DRM等安全机制,可基于多重角色对细粒度区域设置细粒度权限,可以满足各种应用程序对文档存储、展现、检索和安全的需求。

UOML可以实现文档的创建、版式内容定义、文档内容和多文档挂历、文档内容的显现、安全权限等功能要求,是应用程序和文档处理技术的中间界面。通过应用程序调用UOML,就可以实现对文档的所有操作,包括文档组织、版面描述、信息安全、检索查询、内容提取、字库管理、存储管理、插件机制、脚本描述等。

通用性:可以描述所有文档内容,基于通用文档模型的描述,可以涵盖目前所有文档。

无关性:不依赖于任何操作系统、开发环境、硬件平台,不依赖于特定的技术实现。

伸缩性:具有强大的可伸缩性,具有无限扩展能力,而不影响以前应用开发和实现。

UOML联盟的宗旨是:使联盟各成员开发的软件之间,实现文档可交换、互操作,让信息流能够畅通无阻,优化非结构化文档领域的产业分工,使软件开发者能够专注于自己的核心功能,用户得到最优的使用体验,促进非结构化文档产业快速健康发展。

■ SEP文档库技术

SEP(Sursen Exchangable Platform)是全球第一个真正意义上的文档库技术,提供书面文档所有的基础性功能,包括版面描述、RIP、字库管理、信息提取、存储、信息安全、文档组织、检索等,并通过公开规范的非结构化操作标记语言,统一面向书面文档处理的访问标准,为应用软件提供书面文档的通用操作功能。

SEP文档库技术以其开放性,改变了软件业长期以来各厂商文档格式各自为政的现状,使不同软件可以编辑同一文档,甚至是同一文档的同一页。在软件业历史上,第一次实现了文档能够在不同软件之间共享、可交换、互操作的理想,形成了良好产业分工,完善了产业链,使每个软件开发者只需专注于自己的核心功能,可以让用户得到最优的使用体验。

SEP文档库技术的基本功能可以永久免费使用,只有增强功能才收费。所有支持UOML的软件可以实现文档可交换,即一个软件生成的文档可以用另一个软件继续编辑,而且可以完全自如地控制其它软件生成文档的显示界面。

赛迪网JAVA专区,JAVA开发者乐园!
相关文章
· 中国信息化有了新的指路标(2006.05.09)
· IEEE向WAPI示好(2006.05.09)
· IPS部署深层防护体系(2006.05.09)
· 数据中心的深层防护(2006.05.09)
· 刀片的热度上来了(2006.05.09)
·特别专辑

鲍尔默访华再投2.5亿 与信产部签备忘录全文
第九届中国北京国际科技产业博览会召开全文


· 5.17全面解读:第38届世界电信日特别报道
· 专题:英特尔中国区双换帅 杨旭重掌大权
· 2006第十届中国国际软件博览会
· 2006E3:新游戏趣味点评 看索尼等三巨头PK
· 赛迪网访谈:网络杂志——下一站掘金热点
· 五一导购:手机、数码、PC和家电消费指南
· IBM正式推出IBM System z9新产品
· 4.26专题:5大热点透析中国知识产权保护
· 赛迪网大型互动策划:创富先锋系列访谈
· 专题:Google CEO来华 发布中文名“谷歌”

·赛迪社区