论文部分内容阅读
近年来,量化投资在国内日渐受到人们的关注。凭着其纪律性、系统性、及时性及分散化的特点,从我国现实国情来看,量化投资在未来的一段时期内必然有着良好的发展前景。也正是因为量化投资有着如此大的发展潜力,必将会有更多的投资者将目光转向了这一新兴的领域。但是目前国内量化投资产品存在总规模小、策略单一、业绩表现分化等缺陷,因此,对于新的方法的分析研究以及开展不同的建模思路就变得很有必要,并且新方法的引入对于相关的其他量化选股策略也可以提供很好的思路和借鉴。支持向量机分类技术,有着其他分类方法所不具备的优势:首先,SVM在样本有限的的情况下可以有效地对样本进行分类;其次,从理论上可以说,SVM得到的解是全局最优的。这就为解决局部极值问题提供了好的方法,在这一点上SVM算法是优于其他算法(如神经网络)的;最后,因为在具体应用过程中不涉及高维空间H的具体形式,而只是反映在核函数上,因此很好的解决了高维问题的复杂性。因其强大的推广能力及核函数有效的非线性映射能力的优势,可以作为量化选股策略的一种新的方法。SVC方法的基本思想是在选定适当的核函数后,将低维空间的分类问题转化为高维空间的分类问题。在适当的高维空间里寻求满足条件的线性模型,使其能在高维空间下线性分划。文章在对SVC效果评价时,首先简要介绍了在利用线性判别分析分类时的误判率,以此为参照给出了表观误判率的介绍,进而指出此时对SVC效果评价的局限性,引入了交叉验证寻求误判率的评价方法。本文正是基于支持向量机分类技术,利用获取的股票指标作为进行分类的依据,对股票进行分类。在获得的分类结果的基础上,选取表现优异的股票构建股票组合,获得收益率超过大市场的投资策略。在文章中,对于上证A股中九百多只股票的财务数据,在经过预处理、标准化以后进行了变量的特征选取,利用主成分分析方法选出了方差累计贡献率达到85%以上的综合主成分指标。对于得到的以选取的主成分为指标的变量集,利用支持向量机SVM中的分类技术(文章运用的是C-分类机),进行分类。在分类过程中,通过核函数及参数的寻优,得到了分类精度较高的学习机,进而构造出表现优异与糟糕的股票组合。最后将其分别与大市场总体表现(收益率)相比较,经过分析得到了比较好的结果。这也说明了,对于利用SVC进行量化选股的方法是可取的,为以后开发新的量化选股模型,丰富其模型种类方面提供了很好的借鉴。