论文部分内容阅读
【摘 要】本模型采用SVM神经网络算法对2007年的股票形势进行分析、预测及验证,并预测出未来5天的开盘走势,此预测模型的精度达到99%。并结合小波神经网络对其中特殊的国家政策及经济情况分析拟合,使模型更加符合实际的股指走势。将两种算法取长补短,在2012年上半年的股指进行分析预测的基础上,对未来可能出现的经济干扰模型进行预估,预测出未来股指走势。
运用GUI界面将建立的模型输出,使仿真模型更有操作性,运用此界面,选取不同的干扰模型及年份,预测出更合理的股指走势,预测真实可靠。
【关键词】SVM算法;小波神经网络;股指预测;经济干扰模型;GUI界面
一、简介
1.研究的意义及目的
21世纪进入信息时代,随着大家生活水平的提高,股票自然而然也成为了一部分人的娱乐方式,甚至有人成为职业炒股。股票和股票市场对国家企业的经济发展起到了积极的作用,如可以为投资者开拓投资渠道,增强投资的流动性和灵活性等。但股票价格的形成机制是颇为复杂的,股票价格既受到多种因素,同时股票市场是国民经济的“晴雨表”和“报警器”,其作用不仅被政府所重视,更受到广大投资者的关注。对股票投资者来说,未来股价变化趋势预测越准确,对利润的获取及风险的规避就越有把握。因此对股票內在性质及预测的研究,帮助投资者掌握投资的方法,使投资者能更好的预测和分析股市,选择股票进行投资,优化组合投资,降低投资风险,获得最大收益,具有重大的理论意义和诱人的应用前景。
2.股票市场研究现状
国内在股票的趋势走向预测中使用了很多数学方法,比如:神经网络、模糊神经网络、数据挖掘技术以及灰色预测等等。其中有的比较好的方法的准确程度比较高,可是这些建立的模型有的所需要的样本太多,有的对于结果的预测不是非常准确。另外由于股票中的影响因素非常多,单一的用一种方法很难有非常高的准确度。以灰色预测方法为例,它只能在近期内的股票的走势作出预测,假如从长远角度来看,它就需要一些适当的改进和完善。并且对于连续型的数据,要想做相关分析是比较困难的,即使将数据离散化,得到的关联规则也很难找到实际意义。
二、预测及验证部分算法模型
1.Svm的信息粒化时序回归预测
1.1算法选择的意算义。对于股票指数来说,大多时候无法对其进行精确预测,对投资最有参考意义的是:能否预测它未来3~5天的趋势和变化空间?我们先用模糊信息粒化处理原始数据,然后再用svm来进行回归预测,进而可以对上证指数未来5天内的变化趋势和变化空间进行预测,实例验证表明这样的预测的结果是可靠的。
1.2模型建立。(1)目的:从对历史数据的分析训练中,拟合出对长期股指走势及方向,并预测下五个交易日内上证指数的变化趋势和变化空间(整体的变大或变小);(2)模型假设:假设上证指数每日的开盘属于时间相关,即把时间点作为影响上证指数变化的自变量。
算法流程如上图:
1.3模型SVM的数据处理。SVM模型的数据输入:为每一年每一天上证指数的开盘指数,指数最高位,指数最低位,收盘指数,当日交易量,当日交易额;SVM模型的数据输出:最终对六条线数据的关系进行拟合形成一个区间(最大值,最小值)和一个平均值。
股票市场一周开盘5天,因此数据量很庞大,我们将五天的数据通过模型拟合成一个点,故有50到51个点,代表这一年的股指走势。而因为SVM模型最终可在历史数据的基础上对未来的五天进行走势估计,因此最后一点的走向是2008年初第一周开盘的股指一个预测。
2.小波及神经网络时间序列预测
2.1模型选择的意义。小波分析是针对傅里叶变换的不足发展而来的,小波分析能够通过小波基函数的变换分析信号的局部特征,并且在二维情况下具有信号方向选择性能力。近l0年来,人工神经网络作为一种大规模并行处理的非线性系统,在股票价格的短期预测中已取得了令人比较满意的成绩。然而,影响股票价格的因素非常之多,即使是神经网络的非线性预测工具也不堪掌握其规律进行准确地预测。我们试图通过将小波分析中的趋势提取技术应用于证券预测中来提高神经网络的预测精度。具体说就是利用小波分解与重构技术提取出隐藏在噪声中的股票价格趋势,然后用神经网络学习股票价格趋势,最终作出预测,由于剔除了高噪音,可以预期最后的预测精度会有所提高。
2.2模型的建立。(1)目的:利用短期内上证指数每日的开盘数,对影响较大的经济因素的模型进行提取建立,此部分模型可以用于对未来未知股指进行预测;(2)模型假设:
2.3小波及神经网络时间序列预测的数据分析
训练输入事件:影响期间的开盘指数,收盘指数,最高指数,最低指数共4列;训练输出事件:时间影响期间的开盘指数(4周期重复);预测输入:要预测时间点之间的若干天的开盘指数,收盘指数,最高指数,最低指数;预测输出:预测开盘指数。
小波神经网络模型的利用已知干扰影响期的输入输出事件进行训练(神经网络是一个带有反馈的系统的算法模型),经过多次训练以后,在与原有的数据相符的基础上求得一系列权值,我们取其中最为符合的权值最为标准参数,对可能受到此干扰的部分进行预测。同样的预测出的也是一个带有输入输出的新模型。
三、案例验证
1.Svm的信息粒化时序回归预测
左图是利用SVM模型的验证,可看出2007年的走势是一个很明显的上升,从1200多点直升到6120点,是一个让股民疯狂的牛市。因为SVM模型并不是针对某一数据进行拟合与分析,而是将六个具有隐形相关联的数据进行拟合;同时它的输出也并不是一个绝对的值,而是一个相对波动的区间,并根据六条线的权重算出一个相对合理的均值,做出三条曲线。
股指的基本走势,预测线和原始数据线都相对比较吻合,或者说在一个可以理解的误差范围内波动。本年度模型的拟合精确度达到98.94%。 但是2007年在一些折点出会有一些比较大的误差波动,将其看作是股票市场上一个影响较大的干扰,也即是我们先前所说的股票影响因素,此部分作用时间短但是干扰作用大,因为SVM模型下的数据相对较多,可能对此部分的估计有所偏差,我们将在下面用小波及神经网络对其进行短期验证及预测。
2.实际股票市场上典型影响因素模型的选取
2.1上调印花税。2007年5月30日凌晨,财政部、国税总局宣布,即日起将证券交易印花税由千分之一调整为千分之三,其主要目的是打壓股市泡沫。上调首日,股指从5月29日的最高点4335点,一路下滑至最低点3858点(见图1),一日接连击穿五个整数关,跌幅高达477点。由于权重股发动抵抗,到收市,该日中国股市仍大跌283点,900多支个股跌停,创下了2007年中国股市暴跌之最。沪市当日仅有1只B股上涨,4家平盘,50家下跌,其中49只个股跌停。盘点这一天的中国股市,证券交易印花税税率上调的首日,4000多亿的天量成交,使得印花税收入达到约2444亿元。新税率的执行使得印花税增加逾16亿元。
2.2泡沫肆意。经过2006年和2007年两年大牛市,上证综指累计最大涨幅超过了220%,股价上涨已成了习惯,就在人们忘记地心引力,大幅提高预期收益时,市场却来了个180度的大转弯。在创出6124点后的第三周,大盘暴跌462点,8%的周跌幅刷新了沪深股市9年来的最高记录,突如其来的暴跌暗示着一个历史性大顶正在来临。即2007年10月16日至2008年1月14日,沪指从6000点回调下来属于正常,这是挤泡沫的阶段(见图2)。“泡沫”在疯狂的阶段不易被察觉,一旦市场从疯狂归于冷静,那么,价值回归不可避免,而“泡沫”的降低也就势在必行。
四、结论
由以上分析可看出,无论是2007,2008年,即便是数据较少的2012年,股指的基本走势,预测线和原始数据线都相对比较吻合,或者说在一个可以理解的误差范围内波动。在一年中出现较大经济干扰的时间点,加入小波神经网络拟合出的局域模型,将其与SVM长期预测模型结合起来,以弥补一些比较大的误差波动。
本模型既提高了单一模型预测结果的准确度,也不在只是对近期内的股票的走势作出预测,从长远角度来看,本模型因为适当的改进和完善使得并且对于连续型的数据,做相关分析更加容易,并将数据离散化,得出其中的关联规则,使其模型的适应性更加宽广。
运用GUI界面将建立的模型输出,使仿真模型更有操作性,运用此界面,选取不同的干扰模型及年份,预测出更合理的股指走势,预测真实可靠。
【关键词】SVM算法;小波神经网络;股指预测;经济干扰模型;GUI界面
一、简介
1.研究的意义及目的
21世纪进入信息时代,随着大家生活水平的提高,股票自然而然也成为了一部分人的娱乐方式,甚至有人成为职业炒股。股票和股票市场对国家企业的经济发展起到了积极的作用,如可以为投资者开拓投资渠道,增强投资的流动性和灵活性等。但股票价格的形成机制是颇为复杂的,股票价格既受到多种因素,同时股票市场是国民经济的“晴雨表”和“报警器”,其作用不仅被政府所重视,更受到广大投资者的关注。对股票投资者来说,未来股价变化趋势预测越准确,对利润的获取及风险的规避就越有把握。因此对股票內在性质及预测的研究,帮助投资者掌握投资的方法,使投资者能更好的预测和分析股市,选择股票进行投资,优化组合投资,降低投资风险,获得最大收益,具有重大的理论意义和诱人的应用前景。
2.股票市场研究现状
国内在股票的趋势走向预测中使用了很多数学方法,比如:神经网络、模糊神经网络、数据挖掘技术以及灰色预测等等。其中有的比较好的方法的准确程度比较高,可是这些建立的模型有的所需要的样本太多,有的对于结果的预测不是非常准确。另外由于股票中的影响因素非常多,单一的用一种方法很难有非常高的准确度。以灰色预测方法为例,它只能在近期内的股票的走势作出预测,假如从长远角度来看,它就需要一些适当的改进和完善。并且对于连续型的数据,要想做相关分析是比较困难的,即使将数据离散化,得到的关联规则也很难找到实际意义。
二、预测及验证部分算法模型
1.Svm的信息粒化时序回归预测
1.1算法选择的意算义。对于股票指数来说,大多时候无法对其进行精确预测,对投资最有参考意义的是:能否预测它未来3~5天的趋势和变化空间?我们先用模糊信息粒化处理原始数据,然后再用svm来进行回归预测,进而可以对上证指数未来5天内的变化趋势和变化空间进行预测,实例验证表明这样的预测的结果是可靠的。
1.2模型建立。(1)目的:从对历史数据的分析训练中,拟合出对长期股指走势及方向,并预测下五个交易日内上证指数的变化趋势和变化空间(整体的变大或变小);(2)模型假设:假设上证指数每日的开盘属于时间相关,即把时间点作为影响上证指数变化的自变量。
算法流程如上图:
1.3模型SVM的数据处理。SVM模型的数据输入:为每一年每一天上证指数的开盘指数,指数最高位,指数最低位,收盘指数,当日交易量,当日交易额;SVM模型的数据输出:最终对六条线数据的关系进行拟合形成一个区间(最大值,最小值)和一个平均值。
股票市场一周开盘5天,因此数据量很庞大,我们将五天的数据通过模型拟合成一个点,故有50到51个点,代表这一年的股指走势。而因为SVM模型最终可在历史数据的基础上对未来的五天进行走势估计,因此最后一点的走向是2008年初第一周开盘的股指一个预测。
2.小波及神经网络时间序列预测
2.1模型选择的意义。小波分析是针对傅里叶变换的不足发展而来的,小波分析能够通过小波基函数的变换分析信号的局部特征,并且在二维情况下具有信号方向选择性能力。近l0年来,人工神经网络作为一种大规模并行处理的非线性系统,在股票价格的短期预测中已取得了令人比较满意的成绩。然而,影响股票价格的因素非常之多,即使是神经网络的非线性预测工具也不堪掌握其规律进行准确地预测。我们试图通过将小波分析中的趋势提取技术应用于证券预测中来提高神经网络的预测精度。具体说就是利用小波分解与重构技术提取出隐藏在噪声中的股票价格趋势,然后用神经网络学习股票价格趋势,最终作出预测,由于剔除了高噪音,可以预期最后的预测精度会有所提高。
2.2模型的建立。(1)目的:利用短期内上证指数每日的开盘数,对影响较大的经济因素的模型进行提取建立,此部分模型可以用于对未来未知股指进行预测;(2)模型假设:
2.3小波及神经网络时间序列预测的数据分析
训练输入事件:影响期间的开盘指数,收盘指数,最高指数,最低指数共4列;训练输出事件:时间影响期间的开盘指数(4周期重复);预测输入:要预测时间点之间的若干天的开盘指数,收盘指数,最高指数,最低指数;预测输出:预测开盘指数。
小波神经网络模型的利用已知干扰影响期的输入输出事件进行训练(神经网络是一个带有反馈的系统的算法模型),经过多次训练以后,在与原有的数据相符的基础上求得一系列权值,我们取其中最为符合的权值最为标准参数,对可能受到此干扰的部分进行预测。同样的预测出的也是一个带有输入输出的新模型。
三、案例验证
1.Svm的信息粒化时序回归预测
左图是利用SVM模型的验证,可看出2007年的走势是一个很明显的上升,从1200多点直升到6120点,是一个让股民疯狂的牛市。因为SVM模型并不是针对某一数据进行拟合与分析,而是将六个具有隐形相关联的数据进行拟合;同时它的输出也并不是一个绝对的值,而是一个相对波动的区间,并根据六条线的权重算出一个相对合理的均值,做出三条曲线。
股指的基本走势,预测线和原始数据线都相对比较吻合,或者说在一个可以理解的误差范围内波动。本年度模型的拟合精确度达到98.94%。 但是2007年在一些折点出会有一些比较大的误差波动,将其看作是股票市场上一个影响较大的干扰,也即是我们先前所说的股票影响因素,此部分作用时间短但是干扰作用大,因为SVM模型下的数据相对较多,可能对此部分的估计有所偏差,我们将在下面用小波及神经网络对其进行短期验证及预测。
2.实际股票市场上典型影响因素模型的选取
2.1上调印花税。2007年5月30日凌晨,财政部、国税总局宣布,即日起将证券交易印花税由千分之一调整为千分之三,其主要目的是打壓股市泡沫。上调首日,股指从5月29日的最高点4335点,一路下滑至最低点3858点(见图1),一日接连击穿五个整数关,跌幅高达477点。由于权重股发动抵抗,到收市,该日中国股市仍大跌283点,900多支个股跌停,创下了2007年中国股市暴跌之最。沪市当日仅有1只B股上涨,4家平盘,50家下跌,其中49只个股跌停。盘点这一天的中国股市,证券交易印花税税率上调的首日,4000多亿的天量成交,使得印花税收入达到约2444亿元。新税率的执行使得印花税增加逾16亿元。
2.2泡沫肆意。经过2006年和2007年两年大牛市,上证综指累计最大涨幅超过了220%,股价上涨已成了习惯,就在人们忘记地心引力,大幅提高预期收益时,市场却来了个180度的大转弯。在创出6124点后的第三周,大盘暴跌462点,8%的周跌幅刷新了沪深股市9年来的最高记录,突如其来的暴跌暗示着一个历史性大顶正在来临。即2007年10月16日至2008年1月14日,沪指从6000点回调下来属于正常,这是挤泡沫的阶段(见图2)。“泡沫”在疯狂的阶段不易被察觉,一旦市场从疯狂归于冷静,那么,价值回归不可避免,而“泡沫”的降低也就势在必行。
四、结论
由以上分析可看出,无论是2007,2008年,即便是数据较少的2012年,股指的基本走势,预测线和原始数据线都相对比较吻合,或者说在一个可以理解的误差范围内波动。在一年中出现较大经济干扰的时间点,加入小波神经网络拟合出的局域模型,将其与SVM长期预测模型结合起来,以弥补一些比较大的误差波动。
本模型既提高了单一模型预测结果的准确度,也不在只是对近期内的股票的走势作出预测,从长远角度来看,本模型因为适当的改进和完善使得并且对于连续型的数据,做相关分析更加容易,并将数据离散化,得出其中的关联规则,使其模型的适应性更加宽广。