ccidnet????

出版日期:2005-06-20 总期号:1421 本年期号:44

本期导读
要闻综合
中国信息化
网络与通信
产品与应用
渠道与市场
华东专刊
华南专刊
东北专刊
西北专刊
企业级搜索引擎的未来趋势

文 北京赛迪数据有限公司 唐欣

  

  近几年,以信息为基础的组织或知识型企业焕发勃勃生机,但企业往往迷失在海量的信息面前束手无策,一方面是海量的企业内数据白白占据存储空间得不到应用,一方面是为了寻找决策用数据,又投入大量资源,造成两方面的浪费。其实运用企业搜索引擎,找到企业需要的东西,是种解脱,也是种趋势。

  

  数字化内容和数据库搜索融合

  数字化内容包括各种非结构化数据(网页、文件和文档管理系统、E-mail等)和多媒体信息(声音、图像、图片等),而数据库包括各种支持业务应用系统的关系型数据库(Oracle、SQL Server、Teradata、infomix等)和群组服务系统(Mircosoft Exchange、Lotus Notes等),模数(Analog to Digital)转换技术的发展,数据传输速率的提高将带动企业的数字化资产进入快速膨胀阶段,如何通过统一的智能化搜索引擎,或者说,从一个单一的视角引导企业进行数字化资产的全面融合和有效挖掘,是企业级搜索引擎面临的一个重大课题。

  平台化发展

  内容和数据融合的趋势,实际上是体现了从企业级搜索引擎(Enterprise Search Engine,ESE)发展为企业级搜索平台(Enterprise Search Platform,ESP)的一个趋势。现有的企业级搜索引擎往往针对非结构化数据或数据库查询,根据用户的检索和查询返回并罗列相关的查询结果,不支持对信息的探索和分析。而企业用户对信息查询的真正需求要远远超出查询结果本身。他们需要结合文本搜索、数据库查询、数据和内容归一化、语义和句法分析工具、分类和聚类、文本和数据分析最终去发现相关的模式、关联和趋势,同时借助发布工具将上述结果与具有相关权限的人员进行分享和交流。因此传统上分离的数据库和内容管理技术必须紧密结合,在搜索平台上是融合在一起的,包括搜索和查询、文本和数据挖掘分析、内容管理和数据仓库。实际上,搜索引擎转向搜索平台的过程同样体现了系统架构设计从面向对象到面向服务的发展过程,从以技术为本的设计理念转化为以业务为本(实际上是以人为本)的设计理念。

  同时,搜索平台化可以更好地解决企业搜索的安全管理问题,继承或映射原有系统的安全权限管理机制。

  整合推动应用

  企业级搜索引擎的应用是与企业的业务应用系统紧密结合的,国内外多家企业级搜索引擎提供商,同样也是内容管理、知识管理、竞争情报、客户关系管理等解决方案的提供商,例如国外的Autonomy、Vertiy、Convera等,国内的TRS、百度等。

  作为相对独立的系统架构和应用,只提供单纯的搜索服务是不能够满足企业级用户对搜索引擎的需求。多数专业的数据库应用提供商都拥有各自的搜索技术,并绑定在其软件系统产品中,例如DB2、Oracle、SAP和Lotus等。因此作为企业级搜索服务应用,结合种类齐全的抓取器,结合内容和数据分析挖掘工具,结合分类和聚类方法,结合可视化显示技术,结合智能化和个性化的服务,应该更多的参与到对搜索结果的信息分析和支持业务系统的决策分析中,才能使企业级搜索引擎的发展更具生命力。