基于数据挖掘的企业欠税预测研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:xiaoshuishe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术的广泛应用,通过数据挖掘等方法发现隐藏在大量业务数据背后的知识,将这些知识应用于决策支撑、商品营销等多个场景,可以为政府工作带来很多便利、为企业带来更多营收。利用数据挖掘技术针对税务数据进行企业欠税预测研究可以保障国家税收收入,同时为税务稽查部门带来很多便利。本文以某省地税局提供的税额征收记录以及企业注册信息为基础开展税源欠税研究,首先分析了税务记录的数据特点,如各字段的含义以及字段之间的关联,并据此制定了对应的过滤策略。为研究企业纳税行为与宏观经济及所在地区的关系,本文基于征收记录以及税务部门提供的数据字典建立事实表和维度表,从而建立数据仓库进行多维主题分析。通过多维主题分析发现,企业纳税税额及欠税行为与行业发展、所在地区存在一定的时间关联性,因此本文统计企业的税务数据包括每个企业每月的缴税数据、企业所在行业每月的缴税数据、企业所在区域每月的缴税数据作为判断企业是否欠税的一类决策特征,同时建立基于投资人、法人等关联人的企业网络,统计企业所关联企业每月的缴税情况作为描述企业营收情况的一类特征。为保障国家税收收入,本文根据企业之前一段时间的缴税信息预测下一个月企业是否欠税开展企业欠税的预测研究,采用基于数据挖掘的分类预测思想,通过统计观测时间窗口内的企业缴税信息、企业所在行业以及地域的缴税信息、企业关联企业的缴税信息作为特征,选择分类算法生成分类预测模型,预测下一个月是否会发生欠税行为。本文通过选择不同的实验数据集、属性筛选前后、设置不同的观测时间窗口数以及选择不同的分类算法对本文的分类预测模型的性能进行对比实验。实验结果表明:基于决策树的Random Forest分类算法的性能最优,分类模型的准确率、召回率、F值均可高达90%,企业欠税是可以通过企业之前一段时间的缴税情况以及所在行业、区域的缴税情况进行预测的,本文所提出的特征构建方法具有较强的适应性。
其他文献
百度文库再次因侵权问题被告上法庭一案说明当前文档分享平台的利益纠纷仍未得到彻底解决。审视围绕文档分享平台联接起来的各种利益关系,协调好这些关系不仅是当下维权的需
近年来,我国的农业部门以及地方政府对咖啡产业的发展逐步重视,咖啡生产逐步提速,并成为我国部分热带地区的支柱产业,是出口创汇的的重要产业。基于此,通过分析中国咖啡产业
退耕还林自2000年在宁夏隆德县开始试点实施,实施16 a以来效益明显,但后续产业开发滞后。基于此,从各个方面分析退耕还林后续产业开发滞后的原因,并提出解决后续产业开发滞后
1992年11月,财政部颁布了《企业会计准则——基本准则》,并于1993年7月1日开始实施。伴随着经济的迅猛发展,全球化进程不断加快,对该准则进行修订已迫在眉睫。2006年2月15日,
农业政策的制定需要为农村经济发展奠定环境基础,其势必会对农村经济发展模式造成不同程度的影响。基于此,从这个角度出发,阐释农业政策与农村经济发展之间的关系,由此提出完
简要综述了独一味及其制剂的药理作用和临床应用研究的最新进展,并对其今后的研究方向提出了建议。认为独一味有良好地利用价值和开发潜力,对其研究开发的前景广阔;对其药效
目的探究分析医院中药房优化管理在提升药学服务水平中的应用,并总结相应的效果。方法分析该院与药学服务和中药房优化管理的相关文献,从中进行总结分析,探究中药房优化管理
哈尔滨是一座有着独特文化底蕴的城市,也是一座蕴含巨大发展潜力的城市。在创建全国文明城市的实践中所形成的哈尔滨创城精神,是哈尔滨精神、哈尔滨风尚的传承、丰富和发展,既彰
目的: 研究和探讨运用作业疗法对乳腺癌患者行根除术之后在康复锻炼过程中的应临床价值.方法: 对本院近年来的乳腺癌行根除术患者进行分组护理,观察两种不同护理方法对患者的肢
国外传媒集团通过并购完善企业战略,扩大经营规模,拓展新的领域,实现协同效应,占领国际市场,在并购中迅速成长。他们的并购实践和特点,对于我国出版传媒集团实施兼并重组及跨