基于数据挖掘组合模型的股价预测研究

被引量 : 0次 | 上传用户:w5130293253
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
改革开放以来,随着我国经济的快速发展,股票市场也应运而生。我国股市自成立以来,历经了风风雨雨之后,获得了快速的成长,逐步发展壮大。一方面在推动实体经济发展,完善市场经济机制,合理分配社会资源,促进生产要素重新组合与合理流动等方面发挥着越来越积极的作用;另一方面随着人民生活水平的日益提高,人们剩余的闲置的资金也越来越多,股票也成为了人们投资、财富保值增值的重要手段。股票市场由于其高风险高回报的特性,长期以来,不断吸引人们投入到其中,逐渐成为许多人投资的重要手段之一。越来越多的人将手头的闲置资金投入到股市,以期获得较为可观的回报。但是,股票市场是一个极其复杂的、不断变化的经济系统,它受到宏观经济运行、政策变化、行业发展周期、投资者群体等多种因素的综合影响,使得人们很难准确地找到股票价格走势的规律和逻辑。由于专业知识的缺乏、信息的不对称性等等原因,人们对于股市的投资往往带有盲目性、投机性,很难获得较好的收益。因此,对于股票市场,寻求一套有效的方法,降低人们投资的风险,同时提高人们投资的收益就显得尤为重要。目前常用的股票投资的分析方法主要有如下两种:基本面分析法和技术分析法,其中基本面分析主要着眼于投资标的股票的选择上,而技术分析则主要在具体投资买卖操作的时间和空间判断上起作用,试图用以提高投资分的析可靠性和准确性。对于中小投资者来说,在做基本面分析时常常会受到资料不足、分析工具不全面、个人知识面不够和分析能力欠缺的制约。技术分析以传统的证券分析理论为基础,以股票市场交易价格走势作为主要研究对象,以预测股票价格走势趋势为主要目的,往往从股票过去交易的图表和数据入手,试图找到股票市场波动规律并用以指导投资操作。比较著名和常用的有波浪理论、江恩理论、道氏理论等。在股票市场中,时刻都会产生大量的交易数据,上市公司也会定期发布大量的财务数据,如何有效地利用这些数据,减少投资者的投资风险,从而给投资者带来较高的回报便成为了一个非常值得分析和研究的问题。上市公司定期发布的财务报告数据具有很重要的信息含量,这些信息含量包括各种财务比率指标。综合这些财务指标,能够一定程度上反映公司整体的经营运行状况和赚取利润的能力,有利于投资者判断公司的内在价值,从而有助于投资者更好地判断上市公司股票价格的未来变化。对于中长期的投资者来说,如何利用这些信息来判断股票的未来投资价值,显得尤为重要。而本文试图通过数据挖掘技术,来研究上市公司财务比率指标的动态变化和股票价格变化趋势的内在联系,期望挖掘出财务数据中有用的信息,从而对股票的投资决策做出更好的判断。传统的统计模型对于数据有较高的要求,对于数据的假定较多,要求过于严格,实际中的数据往往很难达到这种要求,而数据挖掘技术对于数据的要求相对较低,能够相对较好地处理非正态、非平稳、高噪声的数据。数据挖掘通过结合统计学、机器学习和人工智能等技术对于处理海量数据和高频数据往往能够达到不错的效果。另外数据挖掘还能够对不断获得的新数据进行模型的动态更新,非常适合应用于新环境。数据挖掘是当今国际上统计学、人工智能和数据库研究方面最富活力的新兴领域,从大型数据库中挖掘有效信息的问题已经成为近年来数据分析研究领域中的一个新热点。股票投资风险与机遇并存,如何把握风险,使投资回报最大化?是投资者追求的目标。在上市公司公布的财务数据以及股票行情数据库中积累了大量的历史数据,如何充分利用这些历史数据,为投资者提供决策依据,把数据挖掘方法运用于股市投资研究和探索变得很有意义。因此,本文尝试用数据挖掘中的方法来以及组合模型对上市公式财务数据进行分析,目的是发现公司财务数据的变化和股票未来价格变化的联系,为投资者提供参考。本文基于国内外相关方面研究成果,介绍了数据挖掘的相关理论,并且引入数据挖掘的相关方法对上市公司两年间的财务比率指标的变化量和股票价格变化之间的关系进行了研究分析,最后运用组合模型对数据挖掘的几种方法进行组合和优化。文章中用到的数据挖掘技术包括决策树分类、神经网络模型以及logistic回归模型三种方法,将三种方法运用于股票价格预测分析中,通过三种方法来研究上市公司公布的财务比率指标两年之间的变化量与股票当年的价格涨跌之间的内在联系,并试图寻找哪些财务指标对于上市公司的股价的变化有较大的影响,并且对三种方法取得的结果进行评估和对比分析,比较各种模型在进行实证分析时取得的效果,评价各个模型在预测精确度和稳定性方面的优劣。组合模型是基于几个单一模型,希望能够在一定程度上避开它们的缺点的组合方法,通过几种单一模型达到它们性能的结合于互补,克服它们各自的缺点。希望能够在最终的模型中使得股票分类预测变得更加精确、稳健并更容易理解。本文试图通过决策树模型来挑选上市公司的有效财务指标,剔除冗余指标对预测结果的干扰,并且利用logistic回归计算出分类的概率p值。将挑选出来的有效指标和p值作为输入层建立混合神经网络模型,最后得出组合模型的预测结果。本文以上市公司公布的财务比率指标计算出两年的动态变化量作为输入变量,以个股相对收益率作为被解释变量,并结合历史数据建立模型。从而更好判断股票的投资价值。文中建立模型时以上市公司公布的两年财务指标差额作为输入变量,为便于不同上市公司的比较,财务指标均选取财务比率指标。并为了综合反映公司的运行状况,从公司盈利能力、偿债能力、发展能力、运营能力以及现金流五个大的方面来选取指标,以更为准确的反映公司的内在价值。此外,以个股相对收益率作为目标变量建立模型。其中个股相对收益率为二元变量,当股票一年期的涨跌幅大于大盘指数的涨跌幅时取“1”,否则便取“0”。文章的思路便是以综合反映上市公司运行状况的财务比率指标的变化量为输入变量,以个股相对收益率为目标变量,来研究分析上市公司公布的财务比率指标和上市公司个股相对收益率是不是存在关系,如果存在关系,哪些财务比率指标对个股赢率的影响较大以及哪种模型预测效果较好,这些都是文章中要研究和解决的问题。
其他文献
公司治理问题一直是国内外理论界及实务界的热门话题。公司治理的理论及实证研究可以分为两条线索,一条线索强调公司内部治理机制;另一条线索强调外部市场控制机制。着眼于内
摘要:当代大学生是社会主义现代化建设的后备军,是国家的栋梁,民族的未来,培养大学生高尚品格是健全大学生人格要素的中心任务,也关系到我国社会主义道德建设的全局。目前我国
在市政工程建设中,城市路灯设施的建设与管理是城市建设的重要部分,是保障人们基本生活需求和生活质量的重要方式。同时,城市路灯设施在投入使用后,其运行与维护也是非常重要
目的探讨中西医结合治疗胫骨平台骨折的临床疗效。方法将我院收治的胫骨平台骨折患者60例随机分为观察组和对照组各30例,对照组采用常规方法进行治疗,观察组在常规治疗的基础
新建铁路甬台温线西岙三线隧道为曲线隧道,是目前国内铁路开挖断面最大的隧道。该隧道设计标准高,洞门结构新颖先进,地理环境及地质条件差,进出口距居民区近,上跨排污隧洞,施
英语教学在国内基础教育中越来越受到重视,探讨英语教学的未来走势与前景对语言类教学的理论与实践都起到积极的促进作用。本文从重视程度、低龄化发展趋势、多元化发展方向
目的:初步观察疏肝健脾、清胆和胃法对老年失眠患者的临床疗效。方法:本研究病例为南京市中医院及南京市脑科医院的病人,符合中医及西医诊断标准的72例老年失眠患者纳入本研究,
黑龙江是国家重要商品粮基地,粮食总产量、商品量和调出量均居全国首位。为进一步保障国家粮食安全、探索新型农业生产关系,黑龙江提出建设“黑龙江两大平原农业综合改革试验
<正>《国际贸易术语解释通则》(International Rules for the Interpretation of Trade Terms)是国际商会为统一各种贸易术语的不同解释于1936年制订的,命名为《1936年国际贸
21世纪以来电力系统发展速度越来越快,其不断向着智能化的趋势发展,而配电网的智能化研究受到了电力研究者的广泛重视。在配电网自动化的发展过程中,研究人员逐渐认识到了馈线自