基于随机森林的中国上市公司财务舞弊预测模型

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:yezhenhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
上市公司的财务舞弊预测识别问题一直是国内外学者研究的热点。上市公司的财务舞弊通过虚增收入、虚增资产、虚减费用等多种手段,对公司的财务报表进行违规“美化”,此类行为侵犯了广大投资者的利益,违反了我国相关监管法律,一些著名的案例也在社会上引起了广泛的讨论,因此对财务舞弊行为进行识别就格外重要。国外由于资本市场的成熟对于财务舞弊的研究起步较早,且已有许多成果。在财务舞弊的动因方面,有著名的“冰山理论”、“舞弊三角理论”、“舞弊GONE理论”和“风险因子理论”等经典理论,这些理论强调财务舞弊中主观性、动因性的因素。对于财务造假识别模型,国外也有Mscore和Fscore这两个被广泛应用的模型,其中Mscore因对影响巨大的安然财务造假案做出提前的正确预测而闻名,以八个财务比例指标为基础建立的适用西方资本市场的上市公司财务舞弊预测模型。Fscore是在Mscore的基础上进一步建立的,同样选取美国资本市场的财务舞弊公司作为研究对象,但扩充了指标的范围,从应计项、财务报表数据、非财报数据、市场信息和表外业务五个角度对舞弊公司进行全面检测,最终发现只包含财报数据的预测模型效果最好,正确率达69%。逻辑回归模型是上市公司财务舞弊领域应用最广泛的模型,其他数据挖掘方法如概率神经网络、决策树和贝叶斯信念网络等也被越来越多的学者吸取进行舞弊行为的识别,但随机森林方法在舞弊识别领域的应用则较少。随机森林在信用卡欺诈领域已有所应用且取得了较好的效果,但在财务报表舞弊领域的应用则几乎空白。目前学者对于财务舞弊的研究大多集中在判断上市公司是否发生财务舞弊,因变量为二元变量,而自变量则多种多样,传统的逻辑回归模型假设自变量之间相互独立,但这在以财务数据为主的模型中往往不一定成立。而随机森林则不需要对变量之间的相互作用是否显著进行判断,对噪声和异常值的容忍程度较高,预测能力较强,同时具有不易过拟合等优点,可以处理大量的输入变量,作为一种多功能的机器学习算法,能够执行回归和分类的任务。随机森林还可以利用袋外数据来评估模型的分类效果,用OOB误分率对模型的预测效果进行评估,也可以利用OOB对变量的重要性进行判断。因此本文运用随机森林算法建立上市公司财务舞弊预测模型。本文首先基于Mscore模型中的多个变量,分别进行随机森林方法建模和逻辑回归方法建模,代入1999年-2017年中国资本市场的上市公司财务舞弊信息后,对两种方法在变量完全相同的情况下进行识别情况对比。再进一步引入其他常用的财务指标自变量,利用随机森林对自变量的重要性进行排序从而进行指标筛选,保留最有效的自变量,并建立基于随机森林的中国上市公司财务舞弊预测模型。本文的主要结论有:1,基于Mscore模型,对变量分别应用随机森林方法和logistic回归方法进行建模,结果发现随机森林算法在变量完全相同的情况下产生了更好的预测效果,为Mscore这样原本适合西方资本市场的预测模型的本土化提供了方法上的新的思路,验证了随机森林算法在分类问题上的优越性;2,发现基于其他应收款指数、现金销售率指数、销售管理费用指数、ROA增长率、营业收入指数、存货变动率、软资产比例、财务杠杆指数、毛利率指数、应收账款变动率、扣非净利、总应计项总资产比这十二个指标建立的模型预测效果最好,对非舞弊样本和舞弊样本的预测正确率分别为70.83%和68.01%,总体正确率约为69.42%,对于非舞弊样本和舞弊样本的最高正确预测率分别为80.43%和71.74%;3,通过对变量的重要性排序发现,扣除非经常性损益后的净利润最为重要,其他应收款指数、现金销售率指数、销售管理费用指数等指标对上市公司的财务舞弊行为也有较大影响。本文的主要贡献包括:第一,创新性地应用随机森林算法进行中国上市公司财务舞弊预测模型的构建,丰富了机器学习算法在经管领域应用的方面的研究以及上市公司财务舞弊预测领域的研究;第二,本文提出了对Mscore模型进行本土化应用的可能性方法,即在主要变量基本相同的情况下改用随机森林方法进行建模从而提高预测正确率;第三,进一步吸取其他研究中的相关变量,构建了预测成功率更高的针对中国上市公司的财务舞弊预测模型;第四,本文也具有一定的实际意义,可对我国资本市场的投资者决策、监管机构监管等提高决策支持与经验证据,也为公司内部监督机构、会计师事务所等进行财务舞弊的识别提高一种新的方法。
其他文献
学位
随着金融互联网化不断向纵深发展,支付行业电子化的普及,支付与经济融合进入国家化的新阶段,传统的支付理念和结算方式正在被“移动支付”逐渐改变,从而进一步引领实物货币向虚拟货币的金融变革。而移动支付产业中的一些机构,如第三方支付机构、金融机构等已经开始在此领域做出行动,开展战略布局,已经抢占了一定的市场。面对这一发展机遇和挑战,各大商业银行都期望搭上移动支付这辆和谐号,通过业务创新、加强合作等方式,力
中国经济发展的动力已由要素驱动、投资驱动转化为创新驱动,我国中央政府顺应当前的形势,适时提出了“大众创业,万众创新”这一国家性战略,其中,创新是一种具有创造性的思维活动,创业是把创新思维转为现实创造力的过程。在此背景下,创业者积极整合各种资源,开展创新创业活动,其中资金是创业中最主要的资源之一,解决创业者的资金问题是实现双创战略目标的首要前提,但是创新创业企业(以下简称“双创企业”)大多属于中小企
由于我国大力发展职业教育事业,各个行业的龙头企业不约而同地加入到教育市场的竞争中,竞争越来越激烈,消费者需求也产生很大变化,大量的职业教育机构因此遇到了营销瓶颈,面临着竞争环境和市场环境的双重考验。由于消费者的选择面越来越广,学员在考察教育机构时会更加细心地对比,只有在所有细节上都足够完美的职业教育机构才能得到消费者的青睐、教学水平的选择条件越来越苛刻。职业教育机构如何才能在激烈的竞争环境下不断拓
自乡村振兴战略提出以来,各地都试图借助旅游业的元素,集聚乡村发展人气和活力,从而探索乡村振兴的现实路径。对于农村地区来说,传统农业已经不可持续,越来越多的地方期望实现农业的转型升级。“一切皆可游”的理念,被越来越多的地方政府所接受。“农业+旅游”,逐渐成为地方政府乡村旅游的一个模式。本文从农旅融合角度出发,重点回答了“苏北革命老区——涟水县南集镇,是否适合走农旅融合乡村振兴之路,怎样走好农旅融合乡
我国城市商业银行经过了25年的发展,已经成为我国银行体系中非常重要的一员。以湖北省为例,像汉口银行这样的城市商业银行,近些年实现了飞速的发展。随着经济发展进入新常态时期,环境变化与目标市场均对城市商业银行的业务发展和营销战略提出了新的要求。为了保持竞争优势,拓展市场份额,实现可持续发展,社区银行及其零售业务的发展在城市商业银行市场版图中的重要战略地位不言而喻。研究、剖析和推动社区银行零售业务的发展
产业内贸易理论产生、发展始于上世纪60年代,已逐渐成为国际贸易中最重要的贸易形式和研究对象之一,更成为一种重要趋势。产业内贸易体现了国际贸易参与国的国际分工形式、生产水平和技术水平,也为贸易双方带来福祉。因此,本文聚焦产业内贸易这一贸易类型,对中美高技术产业贸易与国际分工形式进行分析。中国加入世界贸易组织之后,中美高技术产品进出口占比不断增高,且出现了中国对美国存在高技术产品贸易大额顺差的“反比较
自2018年以来,中国汽车行业面临了20多年来首次负增长,在国家政策上国六排放的压力,以及行业新四化(电动化、网联化、智能化、共享化)的双重挑战。仍在蔓延的新冠疫情和行业的激烈竞争,F汽车公司其高离职率的背后,薪酬管理中存在的问题被逐渐放大。本文将以F汽车公司作为研究对象,针对其薪酬管理存在的问题,以全面薪酬模型为理论基础,进行方案的优化研究。本文首先梳理了薪酬激励相关理论,阐述了全面薪酬相关的研
近年来,对赌协议在我国重组上市、并购、融资等资本交易中的运用越来越广泛。然而在实践中,部分企业迫于完成对赌条款,通过不当手段去粉饰财务报表进行财务舞弊,陷入“对赌陷阱”。因此,针对ST百特签订对赌协议诱发财务舞弊的案例开展研究,具有一定的理论意义与现实意义。论文选取了ST百特为研究对象,采用文献研究法对对赌协议及财务舞弊的相关研究进行了整理与概括,为后文的案例分析奠定基础。然后,采用案例分析法对S
大数据、云存储、云计算等新型信息技术不断涌现,经济全球化推波助澜,跨国经营浪潮席卷全球。具有庞大经营规模的企业为了突破日益凸显的经营管理局限,开始推行财务共享实践。许多国外企业将经营版图扩张到中国,财务共享概念在我国迅速传播,开启了国内财务共享服务模式探索时代。但是随着经济发展,只着眼于基础核算型财务的财务共享服务中心不再适应当下市场经济发展新局面。企业急需打造一个业务财务深度融合的信息系统平台,