基于命名实体识别和情感分析的金融新实体风险预警研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:heran3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代,深刻地影响了每一个人的生活,特别是自19年底的新冠疫情开始,互联网的重要性更加凸显。用户在互联网上对生活的分享产生了大量的主观性信息,这些数据数量庞大,并且每天以指数级增长,能否及时高效的获取分析其中的信息是当前的研究热点。受益于国内大环境,我国金融科技的发展遥遥领先世界平均水平,金融科技的快速发展正在淡化传统金融业务边界,防范化解可能带来的金融风险,甚至可能引发的社会风险,防止风险传导突破时空限制是一个重要课题。本研究通过建立基于命名实体识别和情感分析的金融新实体风险预警模型,构建了包含网络借贷中介、线上交易所等在内的金融新实体负面清单。以线下门面金融服务、遍布各处的金融广告为代表的传统经营形式正在逐步转移到线上,产生了大量的包含广告信息和用户主观性信息的互联网文本。尽管网络上的情感分析数据集质量很高,但都缺乏对文本所描述的主体进行的标注,在进行具体工作时往往会面临困难。现有研究主要关注于互联网金融风险演化、放大,甚至引发系统性金融风险的问题,对于散落在民间、具有互联网特质的P2P产品并不能很好地监测。首先,本文通过构建基于预训练语言模型的ERNIE-Doc-Bi LSTM-CRF命名实体识别模型,获取了每条数据所描述的主体,相比传统模型,ERNIE-Doc预训练语言模型从词向量出发,结合位置编码构建了独一无二的词向量,良好的解决了一词多义问题,精读略读机制很好的实现了长文本的处理,有效的捕捉了上下文信息,实验结果证明本模型在准确率、召回率、F1值上均有明显的提升。其次,针对当前中文情感分析中存在的长文本处理能力不足、中文语义对结果带来的影响等问题,提出一种基于双判别改进长短时记忆网络情感分析模型,模型内部的双向长短时网络层可以有效提取输入数据的上下文特征,同时通过加入隐马尔可夫判别层,捕捉数据的规律;对置信度低的判别结果进行二次判别,有效提升了召回率,自注意力机制的引入实现了对上下文特征的动态聚焦,对比其他模型在准确率、召回率和F1值上均取得了最优表现。最后在基于上述两个模型的基础上,本文构建了金融新实体风险预警模型,并对经过判别后的金融新实体负面清单进行了展示分析。
其他文献
期刊
阿尔茨海默症(Alzheimer’s Disease,AD)是不可逆的弥散性神经系统退行疾病,受多种基因和遗传变异的直接影响,患者表现为认知功能障碍和记忆损坏。轻度认知功能障碍(Mild Cognitive Impairment,MCI)处于健康老龄化和痴呆之间的过渡阶段,MCI患者已经出现认知和记忆方面的问题,MCI患者是发展为AD的高风险人群。目前AD发病机制尚不清楚,以药物为主的治疗效果有限
学位
期刊
随着深度学习技术在计算机视觉领域的广泛应用,在交通、医疗、军事等高风险领域中采用的模型方法是否具备可解释性和可靠性,引起了广泛的关注。受到近年来频繁出现的雾霾等恶劣天气的影响,基于光学成像系统处理信息的众多领域,由于无法直接获取到清晰的图像而严重影响了后期对信息的准确获取及处理工作。特别是夜间场景中存在人工活动光源,使得获取到的夜间图像被严重降质。由此对于夜间雾霾图像进行清晰化处理成为了重要的研究
学位
跨襄阳北编组站大桥为转体斜拉桥,转体时梁面以上塔高73 m,最大转体重量32 000 t,为提高转体过程中桥梁的抗倾覆稳定性,设计了基于齿轮齿轨传动的多点支撑转体系统。转体系统主要由转动系统(中心球铰、常规撑脚、滑道、齿条)及辅助支撑系统(驱动承力支腿、电气控制系统)组成。中心球铰设计最大承载28 000 t, 6个驱动承力支腿总设计承载6 000 t,通过6个驱动承力支腿的齿轮啮合齿轨实现桥梁转
期刊
miRNA是一类长度约为22~24个核苷酸的非编码RNA,广泛存在于真核生物中,通过调控靶基因的表达在许多生物过程中发挥着至关重要的作用,如早期细胞生长、发育、增殖、分化、肿瘤侵袭和细胞凋亡等,而突变或生物功能障碍的miRNA会导致白血病、肺癌等多种疾病的发生。因此,研究miRNA与疾病之间的关联有助于从分子水平了解疾病的发病机制,对于研究疾病的预后、诊断、评估和治疗具有重要意义。现有的miRNA
学位
桥梁转体过程中处于单点支撑悬臂状态,受外界干扰因素多,是桥梁最不稳定阶段。为保证转体安全,需实时监测截面应力、转体速度、转体角度、牵引力等关键参数。目前主要是人工监测桥梁转体过程,采集并分析数据后再评估结构安全状态,桥梁已转体运行至另一状态,不能及时发现问题,存在安全隐患。此外,由于跨铁路转体天窗一般在夜间施工,人工测量环境受限,测量误差较大,更不能实时反映桥梁工作状态。传统监测方法投入人员及设备
期刊
通过改良方法制备纳米片层状的石墨炔(GDY),采用扫描电子显微镜(SEM)、透射电子显微镜(TEM)、傅里叶红外光谱仪(FTIR)和X射线衍射仪(XRD)等手段对结构进行表征.将其应用于构筑电化学传感器,采用循环伏安法(CV)和示差分脉冲伏安法(DPV)探究扑热息痛在该材料修饰电极的电化学行为.实验结果表明,与氧化石墨烯、碳纳米管相比,Nafion/GDY修饰的电极电化学性能表现更好,10μmol
期刊
!抗菌肽(Antimicrobial peptides,AMPs)是自然界中存在的一种可以先天免疫有害微生物的小蛋白分子,其种类和功能多样,可以特定地作用于肿瘤细胞或有害物质。抗癌肽(Anticancer peptides,ACPs)是抗菌肽的一种,其特点是可以选择性杀死肿瘤细胞而对正常细胞损害较小,其作用机制与抑制细胞分裂增殖失常和靶向作用等生物学过程密切相关。抗癌肽由于其正离子性和两亲性,可以
学位
计算机断层扫描(CT)技术是一种被广泛应用于临床,工业和其他领域的成像方法,是现代临床医学影像诊断的常用方法之一。然而,扫描过程中过多的射线辐射会带来潜在的健康风险。一般来说,有两种方法可以减少辐射剂量:降低管电流和减少X射线管的曝光时间,尽管上述两种方法都可以有效地减少辐射剂量,但是会导致重建的CT图像质量较差(如斑点噪声和条纹伪影),影响临床医学诊断的准确性。现有许多用于提高CT图像质量的方法
学位