论文部分内容阅读
随着全球经济的不断高速发展,金融业进入了蓬勃发展的时期,各种金融产品和金融衍生品层出不穷。作为量化投资领域中的一个重要工具,投资组合理论越来越受到投资者的关注,并对金融投资领域的发展起着至关重要的作用。投资组合理论的本质是探求相对最佳的投资组合方案,也就是在既定的获利条件下使得投资活动所承担的风险降至最低或者是在既定的投资活动风险状况下使得投资活动所获得的利润达到最高水平。时间序列聚类分析是时间序列数据挖掘中重要的研究内容,通常由于时间序列数据的特殊结构,导致一般的聚类算法不能直接应用于时间序列数据。本文提出了一种基于独立成分分析与自适应K-均值算法相结合的股票投资组合构建方法,该方法首先利用独立成分分析对时间序列数据进行特征提取,然后利用改进K-均值聚类算法完成对时间序列特征数据的聚类分析,最后利用基于整数规划的马科维茨模型构建投资组合。将其应用于实际的股票时间序列数据中,数值结果验证了该方法的有效性和可行性。本文的研究内容主要有两个方面:一、传统的K-均值算法需要用户事先指定聚类数目并且由于初始点选择的随机性,无法得到全局最优解。本文借鉴DBSCAN算法的思想提出自适应K-均值算法有效的克服了初始点随机和聚类数目需要人为指定这两个缺点,使得聚类效果更加准确、稳定。二、大多数金融资产的收益序列并不是高斯分布,而是大多呈现“尖峰厚尾”的非高斯分布,而ICA恰恰是处理非高斯分布数据的方法。本文提出基于ICA-K-均值模型的投资组合构建方法,先利用ICA对时间序列特征提取,然后利用自适应K-均值算法进行聚类并利用基于整数规划的马科维茨模型构建投资组合。本文的第一章简要介绍了独立成分分析、聚类分析以及投资组合理论的发展现状;第二章主要介绍独立成分分析的基本理论及方法;第三章主要介绍聚类分析的基本理论及算法并结合K-均值算法和DBSCAN算法的原理和优缺点以及改进的K-均值算法;第四章是提出一种自适应K-均值算法和基于ICA-K-均值模型的投资组合构建方法;第五章是数值实验。最后对全文总结和展望。