基于网络爬虫技术的审计大数据采集与应用研究

来源 :南京审计大学 | 被引量 : 2次 | 上传用户:ososxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
党的十九大对审计监督提出更高的要求,要构建集中统一,全面覆盖,权威高效的审计监督体系,国家审计要适应新时代、新要求、新部署,及时反映和揭示经济社会各领域的新问题、新情况和新趋势,与时俱进地开创审计事业发展的新局面。但随着大数据、人工智能和区块链等新技术的出现,对审计工作的开展提出了新的挑战。大数据时代,传统审计技术方法难以满足现代审计的要求,迫切需要审计人员转变思维,创新审计技术和方法,运用大数据的思维和技术方法,扩大审计范围和对内外部关联数据的对比分析,发现审计疑点,寻找审计线索。在大数据审计环境中,审计电子数据在审计过程中处于“核心位置”,其完整性、一致性、有效性是大数据审计分析的基础,是发现审计问题与线索的关键;是审计报告的重要依据,能够采集完整的、一致性的、有效性的审计电子数据尤为重要。目前,审计电子数据采集主要来源于两方面:一方面是被审计单位提供的,其可靠性和真实性不得而知。另一方面是来自其他方面的支撑数据,如上级主管部门的数据,其他相关单位共享数据,互联网上的公开数据等。前面获取容易,后者往往被人们忽略,尤其在互联网网络页面中隐藏了可免费公开访问的有效数据集,可对审计工作起到重要作用。因此,本文提出一种基于网络爬虫技术审计大数据采集方法。该方法针对当前多维度审计电子数据采集问题,在大数据驱动下从实际应用的角度出发,能够围绕审计目标,根据审计业务内容,自动定义语义文本,自动采集审计相关数据,并且能够融合清洗存储,发现审计问题与线索,以弥补审计过程中数据不足,质量不高,增加其审计数据的完整性,提高大数据审计效率。为了验证该方法的有效性,本文以节能环保重点专项资金审计为例,通过网络爬虫技术在节能环保重点专项资金审计中的应用,论证基于网络爬虫技术的审计大数据采集与分析方法的可行性,并结合案例进行总结,研究成果为未来大数据审计提供了一个可供借鉴的研究方法。本文的主要贡献点在于:(1)归纳梳理了当前审计大数据采集的现状及存在的诸多问题;(2)对网络爬虫技术相关研究进行归纳和总结;(3)在前两项的基础之上,提出基于网络爬虫技术的审计大数据采集与分析的方法,包括基于自定义通用网络爬虫技术的审计大数据采集与分析的方法和基于聚焦网络爬虫技术的审计大数据采集与分析的方法。(4)以具体案例论证网络爬虫技术在审计项目中应用的可行性和实用性。
其他文献
本文论述了如何根据水电工程的实际情况,从决策阶段开始,加强工程及设备全过程、全阶段的管控,确保工程造价合理、安全可靠,实现安全与效益双提升。
铝合金具有高比强度和高比刚度、良好的耐腐蚀性及优异的疲劳强度,航空铝合金薄壁件为装备轻量化、优良的性能提供了可能,广泛应用航空航天制造业,其加工性能的研究是制造行业的共同课题。航空薄壁件加工方式大多是铣削加工,零件成形要求高精度、高效率并具有高性能,但壁厚较薄、刚度低、结构复杂且紧凑等特点造成了加工工艺性差,难以保证加工精度和质量。本文综合考虑实际加工条件,利用有限元仿真技术建立了铝合金柔性薄壁件
在全球经济一体化的推动下,我国的资管业务在迅猛发展的过程中虽然为社会经济的发展注入了充足的动力,但与此同时由此引发的监管套利、刚性兑付、多层嵌套等问题发生频率也越
梨树是异花授粉的果树,梨的大多数品种为自花不实或自花结实率极低。建园时如果未栽授粉品种,或授粉树数量不足,或花期遇阴雨连绵、低温、干燥、霜冻等不良天气,都会明显影响授粉,降低坐果率,这时就需要人工辅助授粉。梨的花序属伞房花序,同一花序中各花开花顺序不一样,边花先开。美人酥属东方梨,红星属西洋梨,都是近几年比较受欢迎的红色梨品种。本试验就是通过对同一花序中不同发育时期的花同时进行授粉,观察这两种红梨