ccidnet????

出版日期:2004-08-30 总期号:1343 本年期号:64

本期导读
要闻综合
中国信息化
中国网络大会会刊
产品与应用
渠道与市场
华东专刊
华南专刊
东北专刊
西北专刊
信息安全
快捷高效的XML搜索引擎
富士通“瞬索”亮相中国


  

  现在,还没有能对应现场数据的多样性变化的成熟的技术

  八月中旬,盛夏时节,“富士通解决方案巡展”在北京、上海、广州三地火热举办。在此次大会上,富士通公司重点推荐了中间件产品——“瞬索XML数据搜索引擎”,并引起了参会观众的广泛关注。什么是“瞬索”呢?它能够解决什么问题?为什么引起那么多人的关注?让我们先从最近的一则新闻说起:

  2004年7月中旬,富士通公司和日本国立遗传学研究所发表声明将在年底推出一个将是全球最快的数据库。该所的Idenken数据库是全球三大遗传学数据库之一。它目前包括3500万条记录,以及398亿组DNA模型,而且它的大小每年都要增长一倍。

  由于每天都有超过10000名用户访问该数据库,这使得快速搜索成为Idenken最优先考虑的问题。它当前系统是基于一个关系型数据库,完成2到3个关键字的搜索需要10分钟左右。而采用“瞬索”后的原型机系统已能够把这个时间缩短至5秒钟左右。


  “瞬索”为什么能这样快?富士通公司的技术人员解释说,“瞬索”的速度这么快的秘密一方面归功于它使用的一个不需要指数的搜索算法,该算法是九州大学副校长有川博士和其研究小组经过10年努力的研究成果;另一方面是因为“瞬索”的软硬件架构设计,“瞬索”技术突破了传统思维,它采用了文本形式的XML型数据技术和在应用方面具有突破性意义的高性能刀锋服务器技术,将搜索请求和搜索数据并行分发到许多廉价服务器上,以提供快速、持续稳定的性能和操作上的弹性。

  “瞬索”的特点不仅仅是快速。实际上,“瞬索”是应对当前社会的信息爆炸,使企业能够充分而有效地利用各种信息,从而给企业创造价值的利器。

  如图所示,随着商业环境的变化,企业必须处理各种形式的数据。但是,实际存在的问题是,并非所有的数据都能在业务和经营等方面得到有效利用。主要原因是因为企业信息的组织结构不能适应在业务现场累积下来的数据种类及形式的多样性。如何应对数据的种类及形式的变化,如何利用累积的数据等等都成为非常严重的问题。

  在目前的信息处理系统中,使用最多的数据管理系统是关系型数据库(RDB)。但是,在业务处理多样化的今天,出现很多RDB只能勉强应对或仅靠RDB无法应对的局面。其技术方面的原因在于以“索引"及“关系"为必要组成的“表格结构"的本身。而RDB是以严密的结构化设计,一旦设计方面发生变更,即使是最有经验的技术人员也为之挠头。

  而XML数据形式,以其擅长应对数据结构变化的特长,因而成为解决问题的关键。但其数据为文本形式,并且使用标签的记述方式,比二进制数据冗长。在数据量庞大的情况下,数据的利用性能将出现很大的问题。

  而“瞬索”把不同种类和形式的数据群统一为XML型数据,使信息得到快速的有效利用。它也适用于在现存系统中要求对查询性能进行改善和实现高速查询的领域。使用瞬索,不需要对在不同的单位或部门进行单独管理的数据进行再构筑,而是将其XML化后,快速地进行统一和联合,实现跨越多个系统的信息系统构筑。瞬索是从小规模到大规模的范围内,对现存RDB技术难以应对的业务领域进行弥补的综合性技术。同时,瞬索的开发及维护都非常简单,可以有效降低TCO。

  以下为具有代表性的Shunsaku(瞬索)应用模式:

  据富士通公司负责“瞬索”产品的有关人士说:2003年“瞬索”在日本正式推出,截至2004年6月,已经实施成功的项目超过50个,正在进行中的项目超过300个,项目覆盖了金融、电信、银行、房地产、通信、教育等各个行业。目前,“瞬索”也在欧美、澳大利亚等地推出,市场反响良好。他说,希望“瞬索”在中国能够为中国客户真正解决问题,带来价值,那是他最乐于见到的。