基于SOM网络改进算法的股票分析

来源 :科学与财富 | 被引量 : 0次 | 上传用户:ssddhwl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:基于SOM自组织特征神经网络的结构和特点,分析了SOM神经网络结构的缺陷。针对SOM神经网络算法的不足进行了改进,结合股票数据属性分类问题,得到了SOM神经网络竞争层个数选取的几个结论,并通过实验验证了SOM网络结构改进的可行性和有效性。
  关键词:SOM神经网络;竞争层神经元;SOM网络分类;股票数据分类
  神经网络的学习不仅应包括参数上的调整,也应该包括神经网络结构上的调整,即竞争层(输出层)的数目以及输入神经元之间的学习方式,对神经网络的性能起着重要的作用。
  1.    SOM(Self-organizing feature map)神经网络简介
  SOM神经网络是一个两层网络,即由输入层和竞争层组成,输入层接收样本,竞争层对样本进行分类,这两层的神经元进行完全相互连接,竞争层的神经元按二维形式排列成一个节点矩阵,一般输入层节点数等于能够代表分类问题模式的维数,输出节点数根据具体问题来决定[1-3]。SOM网络的拓扑结构图1 所示。
  2.    SOM算法
  选取SOM网络竞争层神经元个数依据具体的问题而决定,是SOM神经网络的重要步骤,有没有好的方法来选取竞争层的数目呢?周俊临提出自增长型多级自组织映射网络[4],首先将输入数据映射到只含有2 个神经元的平面上,进行较粗的聚类,然后在下一层中相应位置添加2 个神经元,扩大网络规模以细化某些分类,继续增加新的更大的层,依次迭代下去,最后所有的神经元都满足全局控制的停止条件为止。但是,这种方法迭代次数多,适合于数据很少的问题,当数据很大时,需要多次学习才能满足所需条件,迫切找到一种更快的方法来选取竞争层数目。本文针对这个问题进行深入剖析,提出一種较为合理的选取方法。
  3     数据选取
  选取中国A股市场的000007ST达声原始数据,2004年 3月 2日到2008年 3月 2日的925条股票数据记录,确保了数据源的可靠性。
  4     数据分析与处理
  4.1  数据预处理在本系统中,输入范围在区间[0,1]最佳。采用归一化处理,将数据归一化到[0,1]之间[2,4],求出这段时间该原始数据库的每一个指标(也叫属性)的最大值max(xi),和最小值min(xi),,和分别为归一化前、后的数据,公式为:
  4.2SOM网络算法实现与结论
  本文选用000007ST达声原始数据:开盘价、最高价、最低价、收盘价、成交量。利用SOM网络算法[2,3,4],进行SOM网络训练。设股票数据的属性为:开盘价、最高价、最低价、收盘价、成交量,用股票数据的每一个指标值作为一个输入向量,即P1(x)=(x1,1,x2,1,x3,1,…,x925,1),P2(x)=(x1,2,x2,2,x3,2,… ,x925,2),P3(x)=(x1,3,x2,3,x3,3,… ,x925,3),P4(x)=(x1,4,x2,4,x3,4,… ,x925,4),P5(x)=(x1,5,x2,5,x3,5,…,x925,n),其中,n∈[1,925]。这样,总共有个5 输入向量,即有5 个输入神经元。
  用5 个神经元作为SOM的神经网络输入,每一天的股票数据作为一组输入,总共有925组输入,竞争层选用4×4、5×5、6×6和 7×7个神经元做实验,经过SOM网络学习,SOM神经网络学习925个股票数据,从竞争层神经元得到权值的结果,可以得出SOM竞争层神经元个数选取的结论:
  1)  当竞争层的神经元个数比较少时,竞争层中在同一层神经元竞争学习得到的结果基本相同,80%的神经元得到的权值的结果相差在10%以内。说明竞争层神经元之间的竞争相对公平,竞争层需要增加新的神经元。
  2)  当竞争层神经元在同一层之间的竞争较大时,竞争层中在同一层内有1/3以上的神经元竞争得到的权值相差较大(大于30%)的时候,说明竞争层神经元学习较好,即可取这时的竞争层的神经元作为最终竞争层的神经元。
  3)竞争层神经元的个数随输入样本个数的不同而不同,当输入样本个数较少时,竞争层的神经元个数较少;当输入样本个数较多时,竞争层的神经元个数相对较多。在实际运用中,根据输入样本初始选择竞争层的神经元,当竞争层神经元在同一层竞争得到的结果相差较小时,就要在竞争层增加神经元(改变输出层参数)的个数;当竞争层神经元在同一层竞争得到的结果相差较大时,应该减少竞争层的神经元个数进行学习。直到竞争层神经元在同一层1/3以上的神经元的权值相差较大时,较为合适。这些结论是根据股票数据的分类得出的,可以更快的得到竞争层神经元的数目,不必要用逐层递增的方式进行学习,可以用跳跃式增加的方式进行学习,减少了SOM网络迭代的次数,也缩小了运行的时间。
  4.3SOM网络分类的实现
  根据上面的分析,对000007ST达声 的925天的股票数据的5 个属性:开盘价、最高、最低价、收盘价和成交量进行分类。首先用公式(1)把数据进行归一化处理,然后把股票数据的每一个属性作为一个向量,即用5 个神经元作为SOM的神经网络输入,每一天的数据作为一组输入,输入层共有925组输入数据。由上面关于竞争层层数的讨论,选取竞争层为7 层,即7*7=49个神经元,输出为竞争层49个神经元的分类结果。算法中,η 的初始值取为0.9,R=3,dmin=0.005,竞争层取为7 层;N为竞争层的神经元个数,实现的算法的参数:N=49;R=4,结果如图2。
  该分类算法把925天的股票数据分成了11类,在每一个分类矢量的平均值附近的作为第0 类;高于平均值的数据分别作为第1,2,3,4,5类;低于平均值的数据分别作为第-1,-2,-3,-4,-5类,如图2。
  5     结语
  由SOM竞争层神经元个数的选取结论对股票数据的分类结果可以看出:当样本数据量比较大时,利用上面的结论较容易发现竞争层的规律;调整参数就能进行神经网络的学习;当样本数据改变时,改变参数,即可以进行网络学习,不需要重新从源数据开始新一轮的计算。SOM分类反映了样本集的本质区别,大大减弱了一致性准则中的人为因素。
  参考文献:
  [1]A.Rauber,D.Merkl;etal,“The growing hierarchical self-organizing map:exploratory analysis of high-dimensional data”,Neural Networks,IEEE Transactions on,Volume:13Issue:6,Nov.2002,Page(s):1331-1341.
  [2]闫春,刘璐.基于改进SOM神经网络模型与RFM模型的非寿险客户细分研究[J].数据分析与知识发现,2020(4):85-87.
  [3]P.N Suganthan,“Hierarchical overlapped SOM's for pattern classifica-tion”,Neural Networks,IEEE Transactions on,Volume:10Issue:1,Jan.1999:193-196.
  [4]周俊临.自适应自组织映射网络在模式识别中的应用研究[D].电子科技大学硕士论文:2005.3:34-39.
  作者简介:
  王吉盛(1976-)男,云南宣威人,云南民族大学图书馆,中职馆员,硕士,主要从事数字图书馆方面的研究。
其他文献
摘要:伴随我国经济的发展,人们对于生存环境也有了更高的要求,而城市是人类生存的主要地区,因此只有在城市规划设计的过程中做一个良好的规划,建设出生态城市才能够满足人们日常的需求,更好推进社会的发展进步,改善现如今的生态环境,为人类创造一个宜居、宜业的生存环境。而生态城市建设规划本身就是一个较为系统的工程,因此应该全面的做好生态城市建设规划,这样才能够确保人与自然能够做到和谐相处,更好的进行我国发展生
期刊
摘要:近年来,我国的建筑工程建设有了很大进展,建筑工程的施工管理工作也越来越受到重视。精细化管理是现代企业经营的新概念,有利于工程进度、施工成本及施工工人的管理,通过精细化的管理提高工作效率,从而获取更高的经济收益。精细化管理对企业的发展起着相当重要的作用,因此,主要通过对比传统管理建筑行业的现状与采用精细化管理企业的不同之处,分析精细化管理在工程管理中的应用。  关键词:精细化管理;建筑工程管理
期刊
摘要:在园林建造过程中,管理质量往往比施工质量更为重要,它直接关系着整体施工之间的协调性与各部分的质量管控。因此,想要打造高品质园林,首先应该打造好一支高尖端的管理团队,让园林工程在建造过程中做到井然有序。此外,项目的管理工作也需要处理好,这样才能以最节约的成本打造出更高品质的园林。而要做好管理工作,则可以从质量保证、员工培训、有效管控三个方面入手,以此提升园林工程项目的管理效益与施工效益。  关
期刊
摘要:本文主要针对煤炭价格的主要因素综合预测的研究,利用spss对煤炭价格相关数据的平稳性检验等处理分析,建立了基于定性和定量相结合研究的多元线性逐步回归模型、基于BP神经网络的煤炭价格预测模型以及采用AMRA时间序列的干预分析综合预测模型,从而为我国煤炭市场的平稳发展提供了较为合理的指导建议。首先我们根据有关文献的查阅,通过定性与定量相结合的方式,并对其进行相关性分析以验证合理性,进而建立初始回
期刊
摘要:电费的抄核、收取工作是电力系统管理的重要组成部分,它决定着电力系统的营销内容能否为人们所接受,它的营销质量如何,直接影响到电力系统的经济效益。目前电网建设中,由于用电量的增长和供电网络覆盖范围的扩大,传统的人工电量电费核算工作的效率已不能满足当前的管理需要,需要借助现代技术来创新核算管理工作。  关键词:电量电费;核算管理;创新;实践  前言  电力系统企业作为社会供电系统的核心枢纽,为了保
期刊
摘要:我国属于农业大国,农业是我国经济发展的关键支柱,它解决了我国14亿人口的粮食问题。随着现代科学技术的飞速发展,最近几年全球环境变得日趋恶劣,使得我国农作物病虫害问题日趋严重,甚至对其生产造成了严重的威胁。为此,文章对农作物病虫害防治过程中存在的主要问题进行了详细分析,然后研究了农作物病虫害防治对策,以期为广大农民群众提供科学地农作物栽培技术,防治农作物病虫害。  关键词:农作物;病虫害;问题
期刊
摘要:近年来,国际化进程使得石油化工企业的发展在很大程度上受到国际国内因素的影响。因此,各石油化工企业所处的市场竞争更复杂,风险提高,只有做好销售管理工作,才能在产品营销中应对各种风险,保持竞争优势,提高销售利润。销售工作中,要结合产品性质,制定有针对性的营销策略,从市场营销的角度,提高销售管理的整体水平。  关键词:市场营销角度;石油化工产品;销售管理  0引言  近年来,我国石油化工行业不断发
期刊
摘要:林业发展不仅关系到生态环境、自然环境,对人类社会的生存、发展也存在很大的影响。林业发展模式正贯彻落实可持续发展理念,目的在于对林业的覆盖率进一步提升,促使水土保持和空气净化具有更多的保障。低碳环保营林工程的打造,比较符合城市发展的走向,但是在具体的工作安排上则要保持高度的合理性,结合区域性的诉求来完善。  关键词:林业发展;可持续规划;营林工程;低碳环保  林业的创新必须在各类工程建设上投入
期刊
摘要:现阶段商业银行正面临着巨大的市场冲击,不仅是国内各行之间的竞争变得激烈,而且还面临着大量外资银行进入中国市场的局面,这就迫使银行必须慎重选择营销渠道以及对已有营销渠道进行创新。现阶段,我国大部分商业银行都面临着机构设置复杂不灵活、结构组织臃肿和营销渠道单调无特色等问题。然而营销渠道对于商业银行来说至关重要,这就需要我们结合中国特有的实际情况对商业银行营销渠道进行合理的探索和创新,本文综合考虑
期刊
摘要:人力资源是实现企业可持续发展的重要元素。对于企业来说,只有充分利用本公司的人才,才能发挥人才的最大作用,挖掘人才的潜能。人力資源管理是指对企业人力资源进行挖掘和开发,并通过客观的评价、测量和培训等体系,让每个人的作用得到最大限度的发挥。本文在研究过程中以城市运营公司为研究对象,分析人才管理体系建设实现人力资源的量化管理的路径。  关键词:城市运营;人力资源;量化管理  城市运营公司的主营业务
期刊