论文部分内容阅读
上市公司年度报告作为反映企业经营情况的权威发布文件,相比于其他舆论信息更加正式,给读者带来视觉匿名感,内含大量的主观性文本。主观性文本内容可操纵性强,在描述时可能存在过度美化、避重就轻等情况,在实际监管中,如果管理者有意隐瞒或会计作假,在文本部分可能存在异于往常的情感变化,将在一定程度上误导投资者的决策判断。因此,对这部分文本进行情感分析,对于触发财务审计具有很好的预警作用。由于文本的非结构化特性,分析难度更大,财务审计人员使用常规的分析方法不能准确的挖掘文本信息。因此,本文以年报为研究对象,利用人工智能技术挖掘披露报告的情感信息,探究其在舞弊检测方面的影响。具体研究内容如下:(1)基于语义的上市公司年报文本情感分析研究。该研究结合语料库和知识库的特点,借助通用情感词典自动标引训练语料,利用词向量的方法判别报告中候选情感词的极性,结合权威的金融词典构建了面向年报的中文情感词典,通过匹配语义规则实现篇章级年报文本的情感分析。(2)基于深度学习的细粒度年报文本情感分析研究。该研究采用人工标注的数据集,引入BERT预训练模型实现年报文本句子的向量化表达,以解决目前其他语言模型不能有效考虑上下文语义特征的问题,通过卷积神经网络(CNN)模型实现上市公司年报文本句子级别的情感分析。在此基础上实现了篇章级年报文本的情感分析,并与基于语义的分析方法进行了对比,为后续的基于管理层语调的企业舞弊预警研究奠定统计数据基础。(3)基于管理层语调的上市公司舞弊预警研究。在前文对年报文本进行情感分析的基础上得到企业管理层语调,结合结构化财务数据构建企业经营情况模型。通过实证分析探究管理层语调对企业经营情况的配合机制,发现管理层在信息披露时存在操控行为,为管理层机会主义行为的动机提供了证据,说明年报文本披露的情感信息具有信息增量的作用,可以作为潜在的舞弊预警信号。综上,本文主要探讨了情感分析技术在上市公司年报文本舞弊预警中的应用,证实了上市公司年报文本反映出的情感信息与业绩的关联性以及年报文本的情感特征对于企业舞弊预警的有效性。本研究也具有一定的实践指导意义,基于深度学习的方法有效可以提高年报情感分析的能力,随着社会经济的不断发展,我国正在不断修订年报文本的披露规范,人工标注的训练集对模型的效果有一定影响,基于语义的分析方法有较强的普适性,综合各方法的优势有助于解决目前人工审计难以准确挖掘海量信息的问题。