基于AdaBoost算法多因子选股模型的应用研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ssaifengchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是一门最新发展起来的计算机技术,越来越多的学者开始探索如何将这门技术与股票市场的投资结合起来,以期求得高收益率。AdaBoost算法是机器学习的一种方法,该算法首先构建判断正确率略高于随机猜测的弱分类器,然后通过对数据样本反复学习,最终将弱分类器训练为判断错误率极低的强分类器。本文的目的在于通过结合机器学习算法(AdaBoost算法)和多因子量化选股方法构建基于AdaBoost算法的多因子选股模型,以实现高于基准收益的超额收益。为了构建该选股模型,必须首先筛选出构建该模型所必须的因子。本文选取了优矿量化因子库中的244个因子作为备选因子,并对因子进行了有效性的筛选和独立性检验,最终筛选出10个因子作为构建模型的“独立有效因子组合”。该模型以这10个因子为弱分类器,对股票的收益率进行反复学习,并根据股票收率的情况对股票进行标识,其中,股票收益率排名前30%的分类标识为1,股票收益率排名后30%的分类标识为-1。AdaBoost算法先给所有股票赋以相同的权重,随后根据弱分类器的分类情况更新组合中股票的权重,分类正确则降低权重,分类错误随之增加权重。弱分类器通过AdaBoost机器学习算法进行反复训练,最后将训练好的弱分类器组合在一起,构成一个分类正确率很高的强分类器。本文基于AdaBoost算法构建的多因子选股模型在回测过程中表现优异,年化收益率为25.5%,比以沪深300股为基准的基准收益率高22.4%。
其他文献
<正>卡特彼勒以"实干成就梦想"为主题,携众多机械设备、最新技术和服务能力亮相BICES 2019,其中包括新一代液压cat~?349型和cat~?323GC型挖掘机、全新Cat 140 GC型平地机、全
随着教学模式的转变,素质和美育教育被纳入了教学中,很多院校都将舞蹈教育设置到教学中.在社会各方面因素的影响下,舞蹈教育发挥着越来越重要的力量,对学生素质和美育教育产
研究目的:研究发现,多数足球运动损伤(60-90%)发生在下肢,其中,膝关节是最常见损伤部位,高达54%。最近研究表明这些足球损伤多发生在比赛的前15分钟和最后15分钟,且多是由于
通过研究发现,在商务电子邮件写作中,不同英语水平学习者在使用模糊限制语的频数上存在显著差异。究其原因主要是产出的模糊限制语呈现出过度使用的倾向,副词性模糊限制语缺
"双一流"建设是党中央、国务院作出的重大战略决策,对于提升我国教育发展水平、增强国家核心竞争力,实现从高等教育大国到高等教育强国的历史性跨越具有十分重要的意义。体育
桉树是我国林业经济种植中非常重要的一种树种,有非常高的经济价值与药用价值。但随着桉树种植面积的不断扩大,桉树的病虫害问题逐渐显现,给桉树的正常生长和种植户的经济利
蒙古族作为中华民族大家庭的一员,对中国历史文化有着极其重要的贡献,内蒙古蒙古族传统体育反映出鲜明的蒙古族文化特征。文章运用项群分类理论,通过文献资料法和田野实证法
舞蹈美育在现代教育中,不仅可以塑造学生体形,更可以有效培养学生的智力、健康心理、创造力、审美能力,有着其他学科无法比拟的作用,对于培养全面发展、身心健康的高素质人才
目的研究交联壳聚糖膜固载纳米MnO2对水中汞的去除性能。方法采用溶液共混法制备壳聚糖负载纳米MnO2膜,研究了其在不同pH值(2~12)、不同吸附时间(5~120 min)和温度(25~45℃)下对
油茶(Camellia oleifera Abel.)是我国南方特有的木本食用油料树种,炭疽病是油茶的主要病害,抗病油茶良种是油茶产业化发展必要的基础条件,但油茶抗病潜在的分子机制至今还不