论文部分内容阅读
近年来,“大数据”的概念逐渐进入到人们的视野中,“大数据”技术又叫做云技术、数据挖掘技术,在金融、电商、医疗等行业中有着非常广泛的应用。本文就从传统的数据挖掘技术出发,研究了关联规则方法,并将其运用到股票投资组合中,研究了在一定时期内股票投资组合的收益情况。本文首先介绍了Apriori算法和FP-Growth算法。然后结合股票数据量大的特点,采用分而治之的思想来分解数据集,在每个子数据库中运用FP-Growth算法挖掘关联规则。最后将所得到的关联规则合并得到相对于整个数据库的关联规则。在处理股票数据时,由于本文研究对象是股票每个交易日收盘价的涨跌幅情况,因此文中将复杂的股票数据集转化为只包含0和1的数据集,然后使用数学软件来实现关联规则的挖掘。最后在评价结果的优劣时,给出了规则的长度对于支持度、置信度、选择机会、时间成本的影响。