BI技术在江苏国税系统的应用研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:selangzhiyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文讨论了利用BI技术将分析决策所需数据从税务机关日常运行环境中分离出来,使用户能够方便地提取所需的数据,同时又不干扰业务数据库的正常运行。解决方案是在原有数据库基础之上构建数据仓库系统。 江苏国税管理信息系统(StateTaxationAdministrationInformationSystemofJiangSu,缩写为STAIS)归根结底是一个事务处理系统,它在决策支持方面的功能很弱。BI是对信息的收集、存储、分析和应用的技术,它主要由数据仓库、OLAP和数据挖掘等技术组成,两者之间有很强的互补性。本文从数据源、系统结构、技术平台、数据仓库构建、基于数据仓库的信息处理、多维建模及OLAP应用等几个方面解决了建立基于税收管理信息系统的BI系统的一系列问题。作为全省国税系统的数据仓库的建设是一个十分庞大、复杂的工程,本人参与了整个系统的设计工作,并在常州等七个市的税收数据基础上建立了税户和税款两个重要的数据集市及OLAP分析应用。 本文的重点是关于BI的系统结构、多级ETL抽取框架、主题域划分的研究以及多维建模技术。本文的主要特色是: (1)在STAIS基础之上建立BI系统。STAIS为BI提供了完备的数据源,BI则弥补了STAIS在决策分析方面的不足,两者相辅相成,形成了完整的税收信息化解决方案。(2)设计了一个切实可行的BI系统结构方案。BI系统的核心是数据仓库,本文在比较研究了当前流行的多种数据仓库结构的基础上,提出了一个BI系统结构,设计一个完整的BI技术平台。由于税收数据源非常复杂,该结构采用了多级ETL抽取框架,经过几个层次的存储区,并对微观数据进行了适当聚集,最终为OLAP或其他数据消费型应用提供一致的、干净的数据,同时也可作为各系统的异地备份。 (3)设计了灵活的可扩展的数据仓库逻辑模型。根据STAIS整合框架,将数据仓库中数据的组织方式按5大主题域进行规划。为支持五个主题域的目标和解决实际问题,设立了更多的主题进行多维分析。在数据仓库主题域设计完成的基础上,完成数据仓库全部主题的详细逻辑设计。 (4)设计并实现了多个重要的OLAP模型。当前BI技术的重点是OLAP,OLAP分析是基于多维模型的,为此,本文对多维建模技术进行了较深入的研究,在研究了多维建模的基本原理和基本方法的基础上,针对数据源的特点以及税务部门决策过程的迫切需要,建立了多个OLAP模型。
其他文献
语音通讯是分布式虚拟环境中用户之间重要的交互方式。语音数据量大,这是所有通过网络传输语音数据的系统所必须考虑的一个问题。两点间的语音通讯,比如IP电话,可以借助语音编码
该文在全面分析移动Agent技术研究现状、研究热点和发展趋势的基础上,重点研究了移动Agent形式化建模、移动Agent规划、移动Agent通信以及移动Agent安全等问题.具体包括:(1)
本文所实现的部分是吉林省科技厅重大科技资助项目――“粮食管理信息智能决策支持系统”中的一部分。本系统主要以吉林省粮食工作为背景,利用数据仓库,数据挖掘,统计分析,知识推
在众多的信息安全技术中,入侵检测系统的发展引人注目。由于目前入侵检测技术的限制,检测系统报警误报率和漏报率都较高。报警数量多,粒度太细,各个报警之间没有联系,因此无法对入
物联网已成为当前世界新一轮经济和科技发展的战略制高点之一,被认为是继计算机、互联网之后,世界信息产业的第三次浪潮。在交通、公共安全、农业、环保、工业生产、电力、物流
信息安全现在已被越来越多的人们所重视,各种安全产品应运而生,如防火墙、入侵检测系统、安全服务器等等,而它们所依赖的系统平台是否安全是这些安全产品能否真正实现其安全功能
该文是国家自然科学基金项目:"电梯交通系统的智能控制及最优配置研究"(69874026)的后续研究.电梯交通配置系统所要解决的是一个复杂的、具有不确定性的决策优化问题.该文在
当前,国内外学者已经做了大量的工作来研究路由协议以及其相应的性能特点,也有少量关于能量方面的协议,但仍然存在许多未解决的问题.该文在总结前人的基础上,对Ad Hoc网络的
本文中,我们提出了两类前沿的基于无线传感网络的目标跟踪算法。第一种使用了射频传感网络;第二种将蚁群优化算法用于目标跟踪,具体如下.  RF传感网络是可以实现人或其它目标
电子公告版,又名BBS,是Internet上一种面向文本的交互式、综合性信息服务系统.随着Internet在中国的高速发展,电子公告版系统已经成为了非常有影响力的信息传播途径.但是随着