ccidnet????

出版日期:2004-10-11 总期号:1354 本年期号:75

本期导读
要闻综合
中国信息化
网络与通信
软件与服务
产品与应用
渠道与市场
华南专刊
华东专刊
西北专刊
广东国税:从数字中 淘金

郭义波

  作为国税总局的两家试点单位之一,广东省国税局的税务分析与决策支持系统第一期已成功实施,并将在广东省国税系统全面推广。通过对IBM DB2信息集成器产品的使用,20个市局、两万多税务干部已真正体会到信息化的便利。



  广东省国税局是全国税收征管规模最大的单位之一。2003年全省国税系统完成税收收入近2000 亿元,约占全国国税系统税收总量的1/7强。

  

  “你知道广东省有多少纳税企业?你觉得我提这个问题奇怪吗?”广东省国税局信息中心副主任黄海军问,“纳税企业动态性很大,得到准确即时的数据并不容易。”

  困惑:让数据发挥更大作用

  广东是经济大省,同时也是税收大省。广东省国税局信息化工作开展较早,在网络建设、设备配置、应用系统开发应用等方面已逐步完善,增值税管理、综合税收征管、出口退税审核、公文管理等应用系统都已推广应用多年,全省1999年就统一了税收征管软件,2002年,实现了地级市信息集中处理,税收业务数据通过技术手段集中到省里。

  广东国税的业务系统在满足日常税收业务需求的同时也采集了大量的业务数据。例如,每年采集2000多万份的申报数据和2000多万份的税票数据,2000多万份的专用发票数据。这些业务数据的背后隐含了十分丰富的信息和规律,但由于他们分散在不同的应用系统中,数据共享度低且格式不统一,加上缺乏快速、高效、便捷的获取信息的工具,往往造成基层单位的日常业务基本上已利用信息技术手段来处理,而管理工作却仍然在以汇报和检查为主的传统的管理模式下进行;各级管理决策层难以及时得到综合、全面、准确的信息;上下级税务机关信息不对称成为信息化建设中的新问题。

  “广东有多少纳税企业?过去的做法是省局下一个文件,全省各市局、县局再转发,直到一线的工作人员,可能涉及到上千人。一句话被上千人理解,不一定就理解成什么样子了。”而且,“广东国税管的120多万纳税户的结构如何?变化怎样?能否和工商登记、地税核对,有无漏管?”黄海军说:“2000年,我们开始思考如何让这些数据发挥更大作用。一方面,业务系统有很多数据,领导想要的又看不到。我们也很困惑,信息化方面做了很多工作,但领导直接能看的能用的不多,觉得离他们很远。”

  需求:税务分析与决策支持

  广东省国税局为解决这些问题,提出建设税务分析与决策支持系统。该系统目标在于,通过建立规范统一、高度共享的综合性主题数据库,建设一个能够对事物(如税收收入)的规模、构成、分布、发展速度、平均水平、平衡程度等特征以及增长变化规律和发展趋势,以及事物之间(如GDP与税收收入)的相关关系、强度及均衡性等问题进行分析的平台。

  针对自己的需求,广东省国税局选择了本土供应商菲奈特公司,原因是该公司的BI产品不仅在技术上领先,其应用层也更贴近国内企业的实际需要。

  有了需求,有了实力很强的合作伙伴,但进展并非一帆风顺。“2000年,我们和菲奈特就开始接触,但前期论证工作花了较长的时间。”黄海军说。当时讨论的主要问题之一就是有没有必要。从体制上讲,管理工作的绩效考核还不是十分量化,加上要各级领导干部亲自用电脑来查找信息、进行分析,能适应吗?

  “对决策支持系统的认识也有一个不断深化的过程。起初,有时会将分析与决策系统泛化地理解为就是一个报表系统,很简单;有时又会太强调决策的复杂性,理解得太高深。而实际上,这是个分析数据并提供决策支持信息的平台。”

  2002初,广州菲奈特帮助国家税务总局做数据分析与决策支持的解决方案,在国税总局选定的两家试点单位——北京国税和广东国税中,菲奈特承接了广东国税的试点实施。经过了较长时间的论证和等待后,这项工程开始正式启动。

  广东国税逐渐确定了项目建设的目标。黄海军介绍说,其一就是要建立数据仓库,实现数据集成。将分散在各业务系统中的格式不一致、口径不相同的数据进行规范化、标准化、集成化。其二,就是要对历史数据进行分析处理,通过对不同时期的历史数据的分析处理,找出事物的发展规律。其三,就是快速获得综合性数据。其四,发现数据间的隐含的相关关系。

  菲奈特公司执行总裁邓新平介绍说,“广东国税自身需求比较明确,我们也把以前做电信、银行业的成功案例演示给他们看,启发他们,让他们更加明晰自身需求。他们把想法提出来,我们设计后,再进行验证,是不是他们想要做的东西。”而这些不同岗位的人,站在不同的角度,对待哪些数据要抽取、哪些数据不抽取也有不同的看法。此外,在应用场景上,还要根据使用者的特点进行界面设计。如果设计得过于简单,势必会失去很多功能。

  实施:分两阶段 加强培训

  在实施方法上,整个工程分为两个阶段。第一阶段,信息中心从信息技术运用的角度,结合关键主题推动初步应用。先是实施数据集中计划,将业务数据集中到数据仓库的部署地;随后,实施各业务系统应用质量考核,提高数据的全面性、完整性和准确性;最后,引进数据展现和分析工具BI.Office。第二阶段,推广初步应用,在应用的基础上完善分析监控的需求,确定主题指标,逐步形成完整的指标体系。结合税收分析方法,实现税收宏观分析,实现信息的快速推送和集成展现。

  项目开始后,广东国税多次调集各市业务人员和技术人员,对系统的主题以及相关指标的口径做深入的讨论;在系统功能方面,开发出了有税务特色的一些挖掘方法,例如评分模型,为税务局做纳税人评估奠定了基础。

  在系统开发和实施过程中,解决了一些技术难题,确定了日增量的方案并实施,对整个增量数据抽取、加载、计算过程设计了自动化程序。

  在系统整合方面,随着2004年7月全省推广“一户式”查询系统,开发了与“一户式”衔接的接口,可以从决策支持系统的报表直接跳转到“一户式”查询系统的查询结果中。开发了通过电子邮件分发决策支持系统报表的功能,使关键报表能够自动发送到用户的电子邮箱中。将系统与办公自动化系统结合,免去了用户安装和升级时的人工操作。用户可以通过办公自动化系统直接进入决策支持系统。

  随着一般纳税人电子申报的推广,利用电子申报数据增加了一般纳税人分析主题,根据总局的规划更新了行业代码等维度。

  根据用户数量大,且用户对电脑技术的掌握程度参差不齐的情况,制作了多媒体教学材料,方便用户自学及日常查阅。

  为了使系统能够顺利应用并取得好的应用效果,从2003年4月开始,省局信息中心多次举办“税务分析与决策支持系统”及数据仓库技术培训班,为全省推广做好了准备。

  运行:优势逐步呈现

  2003年11月,广东国税局分析与决策支持系统正式上线。目前,利用IBM DB2 OLAP Server实现的主题个数近50个,其中包含指标300多个。

  系统上线后,优点逐步呈现出来,表现在:

  更快地掌握情况。“现在,领导随时可以通过决策支持系统查到国营、外企、个体户等不同类型的纳税户的纳税情况以及其他各方面的税收管理情况。通过对专用发票的分析,可以了解省内各市的经济相关性,如2003年某市增值税一般纳税人销往省内各市的年度累计销售额分布就量化表明该市与其他各市的经济相关性。

  更好地履行监督。加强对基层征收单位日常执法行为的监控同样要利用信息化的手段,通过建立自上而下的内部执法电子监控体系,实现对基层税务机关日常执法行为的全面、及时、有效监控的电子化、智能化和自动化。

  更及时地发现问题。通过决策支持与分析系统,设定按月统计,进行月环比分析,很容易过滤出一些增长变化异常的情况。一旦发现有企业退税异常,上级管理人员可以让系统直接定位到可能有问题的基层税局,甚至具体的企业。”

  更准确地找到原因。2003年占全省直接征收入库税额80%的重点纳税人地区分布情况说明了全省纳税大户的分布情况,广东移动通信、广州本田等只占全省126万纳税户0.36%的4556户企业贡献了全省80%的税收。税务分析与决策支持系统提供的逐层钻取的方法让各级领导能够准确地找寻原因。

  更科学地作出决策。在快速掌握情况、履行监督,及时发现问题、准确寻找原因后,各级领导便可比以前更科学地进行决策。而且,随着应用的不断深入,数据越来越严密和形成体系。

  移植:一波三折

  面向省局级机关的系统部署在配置较低的IBM小型机上,而如果要向全省20个地市、几千名员工大面积推广使用,就一定要移植到高配置的大型主机上才行。

  平台移植很早就出现在项目规划里,以为一帆风顺的事情后来却平生几分波折。“按以往经验,我们预计1个月就可以了,谁知却用了接近一年的时间。”信息中心主任黄海军扳指掐算。

  2003年4月份,一方面系统已经在省局开始试用,另一方面,面向全省的系统开始移植。“数据模型变得不稳定,开始是数据存储出现问题,用着用着就发现数据文件不见了。”再后来数据加载出现问题, 50个主题、300个指标的海量数据,要求在12~15小时内完成抽取、清洗、加载、计算,系统稳定性不足。黄海军和他的信息中心骨干们,将50个主题的数据拆包后重新打包,不断拆,不断测试,不断试验。

  尽管采取了很多措施,还是找不到问题的症结,这真叫人困惑和心焦。数据仓库应用算是“前卫”的技术,谁也没这方面足够的经验,最后这件事 “捅”到了IBM和HP全球技术中心和研发中心。越洋电话、电子邮件、视频会议;试测、更换,一波一波,一轮一轮,几个月过去了,几方共同努力,还是觉得不尽如人意。直到最后,抱着试试看的态度,找到是机器配置适应性的问题,改了机器的配置,一切问题迎刃而解。

  事后黄海军总结道:“这不仅是系统集成的适配性问题,也是数据仓库应用走向成熟和广泛应用的必然过程。”他举例说,正如买车一样,一般人买车肯定要看该车的配件好不好找。黄海军笑言“先吃螃蟹的人就是这样”。好在终究是只肥螃蟹,只是吃时放了点辣椒。

  推进:不搞一刀切

  由于这套税务分析与决策支持系统(BI.TAXATION)能够同时适应省局和各市局的要求,广东省国税系统将全面推广使用。

  广东省国税局是全国税收征管规模最大的单位之一,各辖区之间经济发展不均衡,如果在信息化建设中搞一刀切,势必会造成混乱局面。广东国税在建设过程中坚持实事求是的原则,在承认地区间差异的基础上,认真论证各地信息化实施环境,充分认识并发挥各地自身优势,在信息化建设中选准突破口,以点带面,进而在整体上推进。为了减轻省局数据量大的压力,避免各地抢资源,推进区域的更深入应用,省局决定广州、东莞、佛山等经济发达的珠三角城市在省局基础上再建一套系统,而其他城市则直接从省局接入。“统一规划,分步实施,分层利用”,让系统更切实地推进管理智能化。

  技术文档


  广东国税税务分析与决策支持系统示意图

  

  通过数据仓库的ETL过程,将税务征管系统、金税系统、退税系统的数据抽取到ETL中间服务器,经过清洗转换以后,将数据按照主题划分成星形模型存储在数据仓库中。为了保证系统的查询效率,整个数据仓库系统增加了多维数据库,将汇总数据聚合到多维数据库中,最后通过BI.Office的应用服务器将多维数据库、数据仓库和业务系统的数据集成起来,最终展示在客户面前。

  用户点评

  简单、方便、灵活、安全、数据质量提升

  首先是简单。广东省国税局辅助决策支持系统让业务人员通过友好的界面很方便地定义各种报表,随心所欲地设计内容丰富的分析报告,整个分析挖掘过程可以在统一的界面中有效贯穿起来。“零编程”、“零管理”技术让行内的IT人员解脱了繁重的开发、维护工作,使业务部门可以更加方便地获取经营管理报表,维护成本、培训成本很低。即使是对电脑操作不太熟练的一些高层管理人员,通过“管理驾驶舱”也能很快就地利用起系统。

  第二是方便。由于系统提供了即时、灵活、多角度、多层次、准确的查询和分析,包括各种指标的累计值、前期比和同期比,提供现状分析、发展分析和80/20分析等丰富的分析方法。利用这些方便适用的工具,管理层可以及时了解省内各个市的税收完成情况和税收分布;分析纳税人的结构,掌握各个行业的发展趋势,一旦有异常情况立刻锁定、处理。

  第三是灵活。由于行内大部分的数据分析是即席分析,是无法预知的,因此在项目开发阶段无法满足业务分析人员所有的分析报表。通过“零编程”技术,任何人可在客户端、Web或者Internet等任意环境下,访问任意数据源进行动态交互,通过简单的鼠标点击访问和利用所需要的任意信息,定制任意布局、任意复杂度的报表和分析报告,然后按照任意格式输出,操作十分灵活。

  第四是安全。

  第五是数据质量提升。数据仓库的ETL过程发现了业务系统的一些数据质量问题和数据的完整性问题,对业务系统的规范和数据质量提升提供了有力支持。(广东国税)

  总 结

  做BI有四点体会

  黄海军介绍,未来,系统会从深度和广度方向发展,提高数据质量,提升应用效果。比如目前税收征管方式是企业自行依法如实申报,税务机关根据线索进行检查。深入应用税务分析与决策支持系统后,系统就可以根据企业的生产经营和纳税情况运用聚类分析等数据模型对有问题的企业进行较准确的筛选,提高税务检查的准确性。

  黄海军总结说,做决策与分析系统,一是不要盲目追求先进性,而要注重实际性。二是做好项目必要性,可行性论证,在遇到困难和挫折时,要坚定信心,冷静分析原因,及时采取措施,解决问题。三是要注重数据质量,如果数据质量不好,分析就没有意义了。四是一定要有组织保证,要不断明确、完善分析监控的职能及岗位配置,最终做到责任明确,人员到位。项目建起来并不难,但是要充分应用才能最大限度发挥先进技术的作用。