基于SVM算法的多因子选股模型实证研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:kinganguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要是研究如何将传统多因子模型和机器学习算法结合在一起,构建基于SVM算法的多因子选股模型。通过该模型,从沪深300成份股中选取具有投资价值的股票构建投资组合,以期能够获得稳健的超额收益。这既丰富了多因子选股模型的构建方法,同时也为其他一些方法的引进提供很好的思路和借鉴。本文选取沪深300成份股2010-01至2016-12每月最后一个交易日的因子截面数据作为数据样本,其中2010-01至2012-12数据作为模型参数训练样本,2013-01至2016-12数据作为样本外回测,模型构建流程主要分为数据预处理、因子有效性检验、模型参数优化、模型构建与结果分析、模型拓展与优化五个部分。本文构建的选股模型在2013-2016年4年间累计收益率为85.37%,年化收益率达到20.54%,远远超出同期对比基准(沪深300指数)的业绩表现,通过分位组比较分析可以发现,模型业绩随着分位组变化具有显著的递减趋势,说明本文的模型对股票分类的效果明显,能够有效区分强势股和弱势股。将模型与离线学习模型进行对比分析,可以发现超额累计收益率走势相差较大,证明本文模型通过在线学习可以更好地对股票进行分类,能够不断适应市场环境的变化。另外在模型的拓展与优化方面,为了保证因子的时效性,在原模型基础上建立因子轮动分析模型,以及依据预测概率来进行股票组合权重的设置,都能一定程度上改进模型效果。
其他文献
本文结合当今国家大力开展非物质文化遗产保护的背景,对锅庄舞今后的发展进行了文化价值的思考,并倡导人们在经济迅猛发展的现代社会对锅庄舞给予有效的保护、发掘与传播。
随着当今竞技健美操训练和比赛任务的加重,运动性疲劳的产生越来越频繁。运动性疲劳的发生将会破坏运动训练的系统性、连贯性,从而影响训练和比赛的成绩,并给运动员带来生理
目的:初步分析基于gyrB序列的Taqman实时荧光PCR在MTC(结核分枝杆菌复合群)鉴定中的应用。方法:根据MTCgyrB序列设计引物和探针,应用荧光定量PCR对14株标准株及90株临床分离株进行
目的:探讨核素89Sr与153Sm治疗多发性骨转移癌的治疗效果及优劣。方法:对126例伴有不同程度骨痛的广泛转移性骨肿瘤患者随机分为89Sr组及153Sm组,各63例.分别应用核素89Sr及153Sm
患者男,23岁,因“头晕头痛5年,加重伴抽搐发作3+月”入院.患者于人入院前5年无明显诱因出现头晕头痛.间断发作,无恶心呕吐,无四肢乏力.
<正>小学语文阅读教学中,朗读是最重要、最基本的训练。语文课文,都是文质兼美,语言优美的文章,是学生学习语言的好材料,而语言的内化主要靠朗读,朗读不落实,学生语文素养的
目的:了解广州市青年会计从业人员生存质量的现状及其影响因素。方法:采用整群抽样的方法.应用SF.36量表对广州市40多家企业的600名会计从业人员进行现场调查。结果:问卷回收率99.1
介绍了我国实木复合地板的研究现状,探讨了导致实木复合地板翘曲变形的因素及改善措施,并对我国实木复合地板的研究方向进行了展望。
<正>老年人是带状疱疹的多发人群,且病情较重,易形成带状疱疹后神经痛(PHN)[1]。PHN严重影响老年生活质量,在急性带状疱疹(AHZ)期采取有效治疗手段,降低PHN的发生尤为重要。A
微网是解决未来智能电网系统中大规模可再生能源接入问题的重要手段,其中,交直流混合微网兼顾了交流微网和直流微网二者的优点,将成为未来微网发展的主流。微网中通常采用电