引:随着金税三期的全面启动,税务系统的数据分析工作进入了整合数据资源、强化数据管理、提升应用水平的发展阶段。
税务信息化建设发展到今天,从数据积累的角度来看,信息广度已经能够涵盖税务信息的各个业务方面,对于各个税种的征收、稽核、监控、会计等信息都已经在各个信息系统内产生,并被有效地管理起来了,同时通过近几年各地对一户式系统的构建,针对纳税人的信息管理也已初步形成。在这样的条件下如何进行税务信息的精细化利用,是摆在各省国、地税局面前的问题。随着金税三期的全面启动,税务系统的数据分析工作进入了整合数据资源、强化数据管理、提升应用水平的发展阶段。
我们对税务数据精细化分析利用提出了如下四类建设性内容:
信息集成 构建信息集成平台,实现全局数据统一视图,消除信息孤岛;
省级税务分析 构建省级数据仓库,建立省级数据分析模型;
分布式数据利用 构建地市级分析数据分布式系统,实现本地差异分析模型;
实时数据仓库 结合决策支持模型与业务数据模型进行综合建模,实现实时综合治税;
以上四个方面是相辅相成、逐步发展并逐步演进的关系。
信息集成
信息集成属基础建设内容,无论是建设省级数据仓库,还是建设分布式数据利用系统,或建设实时数据仓库系统,信息集成都必不可少。
从业务角度来看,信息集成建设实际是从管理、分析的角度对业务流程及业务数据进行新一轮梳理,原来的税务数据,无论是征管数据,还是稽核数据都是和各个业务流程紧耦合的,换句话说就是数据只有在各个业务系统内才能得到,这就会造成信息孤岛的存在。我们需要从管理、分析的角度出发,将分布在各个业务系统内的数据模型进行一轮梳理,才可以形成一个新的数据视图,将分散的数据片段集合成一个连续信息集合。
从技术角度来看,信息集成建设是利用数据联邦的技术,将各自独立的数据库系统以一种逻辑集中的方式联系在一起,形成一个逻辑集中的综合数据库,依照管理、分析的需求建立各种逻辑视图和物理视图,从而从技术层面上将各个业务数据库的异构性、分布式以及技术路线上的不同进行技术屏蔽。
IBM协助山东地税实现的省级发票管理系统就是这方面的一个典型例子,利用IBM WebSphere Information Integrator,实现了对山东省市县两级约200个异构数据库的发票数据集成,在省一级实现对下属各地市税务部门异构数据库的数据统一管理以及发票管理业务的整合。
省级税务分析
省级税务分析系统建设是在大集中背景下的一个必然趋势,税务分析应用主要包括税务数据源和需求分析、数据仓库构建、分析主题建立、指标体系建立、分析方法选择等。其目的是通过建设一系列的技术手段,将税务系统内的各种数据转换成有价值的信息。
省级税务分析的驱动力来自于业务管理的要求,应首先从省级业务管理、业务提高的角度,以提高税收计划的科学性,加强征收监管环节的可预见性为目标进行业务建模,并通过技术平台的搭建进行经验总结的模型化,从而逐步建立省级平台的分析知识库,对税收管理业务起到指导作用。值得注意的是,我们不能将省级税务分析简单理解为历史数据的多角度、多形式展现,而应该使之具备预测和决策能力。
省级税务分析使用数据仓库技术进行技术平台的搭建,形成以分析模型为主导的海量数据管理平台,这模型包括:
ODS模型 符合数据库建模三范式的业务数据模型;
业务元素模型 从税务管理中提炼的业务要素模型;
汇总模型 基于ODS模型及业务元素模型,对数据进行多级汇总,多角度汇总的数据模型;
多维模型 带有预测、决策模型的数据集合; |