【摘 要】
:
疫情之下,全球金融市场进入大波动时代,各国金融调控政策、突发事件层出不穷,例如美联储无限量QE、欧央行7500亿复苏基金、中美关闭使领馆、阿塞拜疆和亚美尼亚爆发空战...如何智能监控全球舆情,从而最快速地做出反应、最大可能地规避风险,就成了一项特别重要的工作。自然语言处理技术作为一种新兴技术,在发展过程中,便于金融产生了联系。在《全球金融科技权威指南》一书中提到了Econob公司,这家做自然语言处
论文部分内容阅读
疫情之下,全球金融市场进入大波动时代,各国金融调控政策、突发事件层出不穷,例如美联储无限量QE、欧央行7500亿复苏基金、中美关闭使领馆、阿塞拜疆和亚美尼亚爆发空战如何智能监控全球舆情,从而最快速地做出反应、最大可能地规避风险,就成了一项特别重要的工作。自然语言处理技术作为一种新兴技术,在发展过程中,便于金融产生了联系。在《全球金融科技权威指南》一书中提到了Econob公司,这家做自然语言处理落地的公司,他们开发了一套ATRAP系统,可以通过实时新闻来交易,例如如果IBM公司的盈利情况没有达到250亿美金的预期时,他们会卖出IBM股票,反之则会购买股票。每当新闻发布,ATRAP系统便会稽查事实,如果满足了这些条件,它将会自动在市场上下单。所以,本次研究欲针对新闻、分析师评论、论坛散户评论等舆情数据,基于自然语言处理技术,从不同维度分析舆情数据的情感、观点与态度,提炼出具有代表性的情绪指标,分析其对黄金期货价格的影响,并应用到预测当中。本文做了如下研究:(1)本文从主流的财经信息获取网站(东方财富网、新浪财经、英为财经)爬取与黄金期货相关的新闻、散户评论、分析师评论,对网络舆情划分为三类情感(积极、中性、消极),并且自行表注情感数据。采用情感词典法、机器学习模型(XGBoost)、深度学习模型(RoBERTa)对网络舆情数据进行训练与预测。将最新的自然语言预训练模型RoBERTa应用到金融舆情分析,并采用模型压缩算法BERT-of-theseus对情感分析模型进行蒸馏压缩,得到轻量级的RoBERTa模型,应用到后续预测中。(2)生成了每日的新闻、散户、分析师相关四种情绪指标(平均情绪指标、积极情绪指标、波动情绪指标、消极情绪指标)。再利用主成分降维,分别得到新闻、散户、分析师综合情绪指标。(3)进行相关性分析,再利用VAR模型分析不同综合情绪指标对黄金期货价格的相互作用关系。利用随机森林和Lasso来分析三种情绪指标的重要性差异。最后,采用时间序列Transformer模型构建黄金期货价格预测模型,分析加入三个情绪指标对模型预测效果产生的差异。本文研究结论如下:(1)在语句较短的金融文本情感分析上,基于RoBERTa的情感分析模型的分类效果要明显优于传统的机器学习算法和情感词典法,较XGBoost模型F1得分提升了15%,而机器学习模型的效果要明显优于情感词典法。(2)BERT-of-theseus模型压缩算法在情感分类任务上,可以对RoBERTa模型进行信息蒸馏、压缩模型,在损失较小精度的情况下,大幅度提升预测效率,损失F1得分为1%,预测时间缩短到压缩前的30%。(3)新闻、散户、分析师综合情绪指标与黄金期货价格存在相关性,并且是其格兰杰原因。新闻、散户情绪对黄金期货价格具有滞后一期的短期负向冲击,影响在五个周期内衰减殆尽,分析师评论则会产生一阶滞后的正向冲击,并迅速消失。(4)加入情绪指标的Transformer黄金期货价格预测模型相比于未加入情绪的模型,有较好的预测效果。
其他文献
商业银行理财产品是由商业银行根据合同将从投资者处募集到的资金投入金融市场投资,并根据约定到期分配收益给投资者的一类理财产品。随着我国经济的发展和居民的投资观念逐渐增强,银行理财产品自2004年出现以来一直处于飞速发展中,但“刚性兑付”的存在带来了一系列问题,危害到金融市场发展。据此,2018年4月27日资管新规正式下发,明确要求严禁资金池嵌套、期限错配以及打破刚性兑付,揭开了我国商业银行理财产品的
近年来,为了顺应全面改革的要求,大型公立医院纷纷打破地域限制,通过布局多院区谋求更大的发展。“一院多区”的发展对财务管理提出了更高的要求,本文通过探讨和分析“一院多区”发展模式下存在的财务管理问题,提出适应多院区发展的财务管理方法和措施。
随着中国经济的发展,中国家庭的财富逐渐增加,为了实现对资产的增值保值,普通个人对投资的需求也不断加大。股票二级市场创造了许多财富神话,成为了不少人投资的重要选择,伴随着股票市场高收益的则是股票市场的高风险。普通个人凭借自己的知识和研究,虽然也有可能在股票市场中获得收益,不过这种可能性的确不高。目前中国的股票市场已经有大量专业的机构投资者,机构投资者往往吸引了最优秀的人才加入,组成有体系的研究团队,
作为经济市场运行的基础之一,市场信息效率逐渐进入我们的视野。由于当前市场普遍处于非理性的假设下,资产的价格并非是一成不变的,市场中的信息以及某些不可控的噪音都会对其造成影响影响。此时,信息这一变量便成为调节市场运行状态的重要因素,它可以直接对资产价格造成影响,同时能对市场噪声造成的影响进行控制。当资本市场具有较高的信息效率时,投资者可以充分地挖掘存在公司中特有的,未被公开的信息,从而将资源流向引导
在2019年12月20日,黄金期权正式在上期所上市,这是中国衍生品市场进一步发展的重要标志。期权以期货为基础,是一种新的金融衍生产品,具有独特的投资功能和风险管理价值。在2015年2月,中国期权市场推出了第一只期权——上证50ETF期权,相较于海外市场发展较晚。但随着期权制度建设的日益完善,期权市场的涉及范围与国内外影响力日益提高,国内对于期权的需求也日益扩大。自2017年3月起,国内陆续推出了豆
随着人工智能技术的逐步发展,以及围绕图像的深度学习体系的不断完善,深度学习在图像分类领域中愈发发挥着无法替代的角色,其应用范围更加广泛,过往的难题也更易解决。依托过去的技术,实现光伏行业中光伏电池片的缺陷自动分类极为困难,现借助深度学习中的卷积神经网络算法,该难题有望实现落地。光伏电池片的缺陷分类是对电致发光原理下的光伏电池片图片进行分类,卷积神经网络算法能够深度挖掘图像特征,分析以及学习。通过实
随着互联网技术的飞速发展,互联网金融对于传统金融市场的冲击也越来越猛烈,传统金融机构在产品营销方面面临的压力也是与日俱增,如何进行个性化营销成了亟需解决的问题。目前针对个性化推荐,金融机构使用的模型方法还较为简单,较传统营销方式效果提升不明显,故本文基于金融业务,提出了一套推荐方法,该方法能够很好地捕捉到用户的真实喜好,从而做到个性化推荐。它通过利用用户的历史购买记录,生成金融理财产品的向量表示与
大数据时代,随着技术手段不断进步,海量数据不断涌现。分子生物信息学领域的微阵列数据,网络购物的用户行为和交易数据,信息化金融市场的交易数据等等,这些庞大的高维数据给传统分析的低维数据数据分析方法提出了挑战,也推动了多重假设检验理论的应用和发展。随着生活水平的提高,人类寿命不断延长,癌症已经成为危害人类健康的头号敌人。而多数癌症患者早期大多性状不明显,且同一类癌症往往性状表现也不尽相同,如何从分子水
随着长三角一体化发展上升为国家战略,党和国家对长三角区域产业协同发展提出了更高的要求,这对长三角三省一市而言既是一次难得的机遇,同时又面临着前所未有的挑战。长三角地区如何立足自身资源禀赋,形成区域产业分工协作、优势互补的发展格局,打造我国强劲活跃增长极,引领全国高质量发展,成为了一项极具现实意义的时代课题。鉴于此,本文尝试从区域间产业关联的视角,通过编制长三角地区间投入产出表,对长三角地区间的产业