【摘 要】
:
资产收益预测问题的核心是对资产进行合理定价。传统资产定价模型以Markowitz的均值方差理论为基石,以套利定价理论(APT)为补充,经过几十年的发展,形成了一套行之有效的研究框架。然而随着大数据时代来临,传统资产定价研究面临两个迫切需要解决的问题:(1)异象因子不断涌现增多,形成“因子动物园”;(2)传统线性模型(OLS)无法有效识别异象因子间的非线性关系。机器学习,尤其是在各种任务场景中都表现
论文部分内容阅读
资产收益预测问题的核心是对资产进行合理定价。传统资产定价模型以Markowitz的均值方差理论为基石,以套利定价理论(APT)为补充,经过几十年的发展,形成了一套行之有效的研究框架。然而随着大数据时代来临,传统资产定价研究面临两个迫切需要解决的问题:(1)异象因子不断涌现增多,形成“因子动物园”;(2)传统线性模型(OLS)无法有效识别异象因子间的非线性关系。机器学习,尤其是在各种任务场景中都表现优异的集成学习boosting族算法——XGBoost、Light GBM、Cat Boost,继承了机器学习用来预测的本质,并且能很好地处理高维输入数据,其内部的树结构通过“分支”为模型增加了非线性识别特点,所以集成学习模型适合作为资产定价研究的备选工具,本文结合集成学习研究资产定价具有重要的理论和实际意义。本文重点从以下方面展开分析:首先对传统资产定价理论和集成学习理论归纳总结,结合两者并提出理论研究框架,分析后发现集成学习模型与传统资产定价模型的最佳结合点位于对资产未来收益预测这一模块,因此,本文利用一个包含167个特征的因子集作为输入,利用集成学习算法对资产的截面收益进行预测。之后的实证部分围绕集成学习的预测结果展开检验和分析,该部分分为两个角度,一个角度是检验集成学习在A股市场中的表现,并回答集成学习在A股市场上是否有可预测性以及集成学习模型的非线性性质能否提升投资绩效两个问题,另外一个角度是对集成学习预测结果做出经济解释的研究。最后根据实证结果提出相应的研究建议。本文的研究结论主要是:(1)集成学习模型在A股市场是有可预测性的,本文采用的XGBoost、Light GBM、Cat Boost模型的预测结果构建的多空投资组合都获得了显著的收益,经过Fama French三因子和五因子模型检验后也能获得显著的超额收益,在控制了A股市场中其他因子后,集成学习模型的定价效果也依然显著,其中表现最好的模型是Cat Boost,其等权重多空组合的月度收益为3.14%,市值加权组合月度收益为2.54%。(2)设置两个基础模型作为对比基准,第一个是传统研究中常用的线性回归模型(OLS),第二个是所有因子中表现最佳的因子构建的单因子模型(MACD60,60日移动均线指标构建的因子),通过集成学习模型与两个基准模型比较来看,集成学习模型月度收益普遍高于两个基准模型,Cat Boost、Light GBM、XGBoost相对线性模型(OLS)月度收益分别提高了48%、34.9%、22.6%,相对单因子模型分别提高了57%、43%、30%。(3)经济重要性表明Cat Boost在考虑交易费用后依然可以获得显著的超额收益,因子重要度分析表明Cat Boost偏好选择公司质量类以及技术、情绪等由市场交易数据构建的因子。最后对错误定价股票的分析表明Cat Boost对低波动、高流动的“蓝筹股”由较好的预测性,并能因此获得超额收益。因此,应利用先进的机器学习技术研究资产收益率的研究中,探究其中的非线性关系,提升模型的效果,建立相关解释框架,从而促进对金融市场内在逻辑的理解。
其他文献
近年来我国脱贫攻坚战取得了巨大成就,历史性地解决了绝对贫困的问题。但是党的二十大报告指出我国依然存在发展不平衡不充分的问题,城乡区域发展和收入分配差距依然较大。农民的增收问题依然是解决“三农”问题的核心。本文通过分析农民收入结构的变动发现工资性收入在农村居民收入中所占比重越来越高,同时随着我国互联网基础设施在农村地区的普及和完善,农村居民也越来越多地使用互联网,而互联网的使用会对农村居民的工资性收
近年来,居民收入不断攀升,人民生活水平全方位提升,城乡收入差距持续缩小,正向着全体人民共同富裕的目标迈进。然而,从目前国家统计局公布的基尼系数来看,我国居民收入差距虽有缩小但仍超过国际基尼系数警戒线0.4。长期过大的收入差距下,要实现全体人民共同富裕的现代化,就要畅通向上流通渠道,创造人人都能参与、机会均等、多劳多得、勤劳致富的发展环境,削弱代际收入不平等传递的影响,防止社会阶层固化。因此,基于收
21世纪以来,随着全球贸易化程度加深,外商投资在全球经济体系中的重要性日益凸显,成为各国经济增长和贸易发展的主要推动力。《中华人民共和国外商投资法》、《关于做好跨周期调节进一步稳外贸的意见》和《“十四五”利用外资发展规划》等政策相继出台,更加表明了中国利用外资构建新发展格局和坚持高质量发展的决心。与此同时,我国内资企业出口贸易总额虽然在不断上升,但产品质量总体不高、国际竞争力不足等问题愈发显著,严
当前,人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾已经成为中国社会主要矛盾。随着第一个百年目标的顺利实现,“扎实推进共同富裕”成为我国下一个阶段的奋斗目标。然而,收入不平等的居高不下以及收入分配格局的代际传承在我国同时并存,其背后由父辈差异所造成的机会不平等正深刻影响着子代收入及收入分配,严重阻碍着共同富裕的顺利推进。父辈因素导致的机会不平等使得子代的个体收入不能完全取决于自身因素的差
近年来,数字经济迅速发展,成为促进国家经济高质量发展的重要引擎。二十大报告中指出要加速发展数字经济,推动数字经济与实体经济的深度结合,目前数字经济正在推动实体经济在生产对象、生产方式上发生深刻变革,其与诸多行业和领域深度融合催生了新的就业形态,拓宽了劳动者就业渠道,增加了就业机会,同时也给很多就业领域带来挑战。基于此,本文以数字经济对女性就业的影响为研究对象,探求数字经济对女性就业影响的作用机制与
自党的十八大以来我国已经顺利进入创新性国家行列,全国高新技术企业数量由4.9万家增长到33万多家。但长期以来,我国企业仍主要通过学习和引进发达国家先进技术,对其进行改造升级、再利用的渐进式创新为主,关键核心技术“卡脖子”问题仍旧存在。在这复杂多变的国内外环境下如何鼓励企业打破原有创新模式,激励企业“另辟蹊径”开拓新的发展领域,成为学者们普遍关注的问题。而资本市场作为企业进行外部融资,获取有效需求资
在如今的经济体系中,各主体间的关联关系日趋紧密且复杂,构成了一张巨大的多主体多层次的复杂金融网络。在这个网络中,由于各主体间的高度关联性,一旦某些主体出现危机,那么就能够通过主体间高度连接的复杂网络迅速扩散,甚至有可能波及到整个网络中的主体,进而爆发系统性金融风险。具体而言,由于各主体间存在高度关联且错综复杂的信贷关系网络,一旦某些主体出现信贷违约,那么可能将会通过信贷网络发生风险传染,对整个经济
近年来,随着货币政策透明化趋势逐渐成熟,预期引导已成为重要的新型政策工具,在调控金融市场的实践中发挥着重要作用,尤其在如今刚刚经历过疫情的恢复时期,经济状况更加难以预测,单凭传统政策措施难以对宏观经济进行有力调控。央行政策沟通在引导公众预期、维持市场稳定等方面有着不可替代的作用。同时,目前公司债已经超过国债和金融债成为我国排名第一的债券品种,在推动金融市场发展、促进经济增长等方面有重要影响。然而快
在宏观经济运行中,借助杠杆可以拉动消费和投资,促进经济,但是高杠杆易引发债务危机和系统性金融风险。我国地方政府债务在保增长、扩内需方面效果显著,但也积累了巨大的债务风险。债务风险是使银行等金融机构和债权人遭受损失的重要风险之一。在融资环境逐渐收紧的情况下,地方政府债务水平高、债务负担重,严重威胁我国金融系统稳定,阻碍经济发展。与此同时,我国经济发展的问题日益暴露,需要摒弃用高杠杆撬动经济的发展模式
面对国际国内经济发展中的诸多不确定性,企业未来隐藏的破产压力可能显现。在这样的形势下,企业必须提高自身实力以应对各种难题。而企业要想提高实力实现可持续发展,单纯依靠企业内部资金还不够,这个时候外部资金的支持不可或缺。债务融资就是一种急需外部资金支持的公司进行筹资时可采取的方式之一。作为企业重要的财务决策,企业在不同的生命周期选择不同的债务融资期限和来源结构实质上代表着一种特定的公司治理结构,无论怎