论文部分内容阅读
党的十九大对审计监督提出更高的要求,要构建集中统一,全面覆盖,权威高效的审计监督体系,国家审计要适应新时代、新要求、新部署,及时反映和揭示经济社会各领域的新问题、新情况和新趋势,与时俱进地开创审计事业发展的新局面。但随着大数据、人工智能和区块链等新技术的出现,对审计工作的开展提出了新的挑战。大数据时代,传统审计技术方法难以满足现代审计的要求,迫切需要审计人员转变思维,创新审计技术和方法,运用大数据的思维和技术方法,扩大审计范围和对内外部关联数据的对比分析,发现审计疑点,寻找审计线索。在大数据审计环境中,审计电子数据在审计过程中处于“核心位置”,其完整性、一致性、有效性是大数据审计分析的基础,是发现审计问题与线索的关键;是审计报告的重要依据,能够采集完整的、一致性的、有效性的审计电子数据尤为重要。目前,审计电子数据采集主要来源于两方面:一方面是被审计单位提供的,其可靠性和真实性不得而知。另一方面是来自其他方面的支撑数据,如上级主管部门的数据,其他相关单位共享数据,互联网上的公开数据等。前面获取容易,后者往往被人们忽略,尤其在互联网网络页面中隐藏了可免费公开访问的有效数据集,可对审计工作起到重要作用。因此,本文提出一种基于网络爬虫技术审计大数据采集方法。该方法针对当前多维度审计电子数据采集问题,在大数据驱动下从实际应用的角度出发,能够围绕审计目标,根据审计业务内容,自动定义语义文本,自动采集审计相关数据,并且能够融合清洗存储,发现审计问题与线索,以弥补审计过程中数据不足,质量不高,增加其审计数据的完整性,提高大数据审计效率。为了验证该方法的有效性,本文以节能环保重点专项资金审计为例,通过网络爬虫技术在节能环保重点专项资金审计中的应用,论证基于网络爬虫技术的审计大数据采集与分析方法的可行性,并结合案例进行总结,研究成果为未来大数据审计提供了一个可供借鉴的研究方法。本文的主要贡献点在于:(1)归纳梳理了当前审计大数据采集的现状及存在的诸多问题;(2)对网络爬虫技术相关研究进行归纳和总结;(3)在前两项的基础之上,提出基于网络爬虫技术的审计大数据采集与分析的方法,包括基于自定义通用网络爬虫技术的审计大数据采集与分析的方法和基于聚焦网络爬虫技术的审计大数据采集与分析的方法。(4)以具体案例论证网络爬虫技术在审计项目中应用的可行性和实用性。