支持向量机在投资决策中的应用

来源 :商场现代化 | 被引量 : 0次 | 上传用户:kunhodde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要] 本文研究了支持向量机在经济上的应用。通过试验取得了很好的结果。说明支持向量机在经济方面的应用有很大的实际意义。
  [关键词] 支持向量机投资决策统计学习理论
  企业进行项目投资可选用内部收益率来作决策,决策规则:设置基准贴现率Ic,当内部收益率IRR>=Ic时则方案可行,否则不行。用这种方法来进行决策比较合理,但计算过程很复杂一般需要一次或多次测算。
  支持向量机是Vapnik等人根据统计学习理论提出的一种机器学习方法.由于支持向量机(SVM)出色的学习性能,已成为国际上机器学习领域的研究热点.目前在手写体数字识别、文本分类、人脸检测等模式识别问题以及函数逼近、信息融合等领域中获得了应用.但目前在经济领域的应用还只是尝试,本文做了基于支持向量机的银行客户信用评估系统研究,可见SVM在经济上的应用还是很有前途的。我们知道,应用SVM作入侵检测最好的效果是检测正确率达到88%左右,但是如果在投资经济领域的能大到这样的效果就非常好了,因为这本身就是一个不可确定的结果,即便是经验丰富的人做出的决策结果也存在不确定性,能有88%的正确率,说明可能性已经很大了。因此用SVM做投资决策时是具有经济意义的。
  
  一、支持向量机
  
  1.广义最优分类面假设有一线性可分的样本集(xi,yi),i=1,…,n,x∈Rd,y∈{+1,-1},为了将yi=1和yi=-1两类点尽可能正确地区分开,可构造分离超平面x·w+b=0,使得
  归一化得yi[(w·xi+b)]-1≥0,i=1,…,n (1c)
  {(xi,yi)}到分类超平面的距离可定义为1/‖w‖,若样本集到该超平面的最小距离最大,则为最优分类面。所以要使x·w+b=0为最优,当且仅当(w,b)是下面优化问题的解:
  这个二次规划问题有惟一的极小点,可以用Lagrang乘子法把(2)化成其对偶形式:
  i=1可以证明解中只有小部分ai不为0,称对应的xi为支持向量。于是最优超平面方程为: (4a)
  最优判别函数为: (4b)
  对于线性不可分的情况,可以在条件(式2b)中增加一个松弛项ξi≥0,成为:yi[ω·xi+b]-1+ξ≥0,i=1,…,n 5)
  目标函数改为求:
  最小,其中C>0是个预先给定的常数,它控制对错分样本惩罚的程度。最优分类面的对偶问题与线性可分情况下几乎完全相同,只是条件(式3c)改为0≤ai≤C,i=1,…,n。
  2.支持向量机。对于非线性问题,作非线性映射Φ(x):Rd→F, F是高维内积空间称为特征空间,Φ(x)称为特征映射;然后在F中构造(广义)最优超平面。实际上不用知道Φ(x)的K(xi,xj)满足Mercer条件,它就对应某一变换空间的内积。因此,采用适当的核函数K(xi,xj)就可以实现某一非线性变换后的线性分类,此时最优分类面中目标函数就变为确切表达式,只需在高维空间进行内积计算。根据泛函的有关理论,只要一种核函数:
  相应的判别函数也变为:
  这就是支持向量机。
  简单地说,支持向量机就是首先通过内积核函数将输入空间变换到一个高维空间,然后在这个空间求广义最优分类面。
  SVM中不同的内积核函数形成不同的算法,常用的核函数有:
  多项式核函数K(xi·xj)=[(xi·xj)+1]q,q是自然数径向基核函数(RBF):
  两层神经网络核函数K(xi·xj)=S(a(xi·xj)+t)其中S是sigmoid函数,a,t为常数。
  
  二、SVM在投资决策中的应用
  
  1.可行性分析。对于独立的方案的决策,常用的评价指标是净现值和内部报酬率。一个独立方案的净现值如为正值,说明该方案可实现的报酬率大于所用的贴现率,经济上可行;如净现值为负值,说明该方案可实现的投资报酬率小于要求达到的最底报酬率,经济上不可行。内部报酬率是指用它来对投资方案的现金流入量进行贴现,使所得的总现值恰好与现金流出量的总现值相等,从而使净现值等与零的利率。也就是投资项目本身可以达到的的报酬率。该指标比较合理,但计算很复杂,有时要经过多次的测算。
  SVM理论是在统计学习理论的基础上发展起来的。由于统计学习理论和SVM方法对有限样本情况下模式识别中的一些根本性的问题进行了系统的理论研究,很大程度上解决了以往的机器学习中模型的选择与过学习问题、非线性和维数灾难问题、局部极小点问题等,所以它们在20世纪90年代以来受到了很大的重视。
  2.支持向量机的构造。根据常用的评价指标选取以下特征向量作为SVM输入向量:输入向量x的属性及含义;对应的输出y为两类:可行与不可行,用1代表可行,-1代表不可行。
  输入数据根据用内部收益率指标已经算的结果来给定。例如:原始投资为5500元,净现金量为11000元,残值为500元,折现年数为10年,通过用测算内部投资收益率为0.157,那么所有基准收益率大于0.157方案为不可行,小于等于0.157的方案为可行。这样可以得到许多组输入向量。根据以上方法我用30个数据做实验,用13个做测试。
  3.核函数的选取。支持向量机在实际应用中关于参数选择的问题还没有很好的解决,比如多项式学习机器的阶数问题,径向基学习机器中的函数宽度问题,以及Sigmoid机器中函数的宽度和偏移问题等,统计学理论目前对这些问题只是给出了一些建议和解释。笔者采用径向基核函数做试验。
  
  三、训练和测试
  
  根据数据按内部收益率指标的计算,笔者可以的到一组数据。这样笔者采用了30个数据来作为训练数据。部分数据如下图:
  经过训练后,用13个数据做测试,得到测试结果(部分数据)如下:
  根据试验结果发现用SVM作投资决策,13个测试数据中有11个判断正确,其正确率达84.6%。
  
  四、结论
  
  1.支持向量机是在统计学理论的基础上发展起来的一种新的学习算法,解决了实际问题中样本有限的问题。
  2.本文研究了SVM在投资决策的应用,结果表明用支持向量机作投资决策的应用取得了较好的结果。
  3.本文的研究的数据虽然具有一定的典型性,但对支持向量机应用于经济领域的研究提供了依据,有很重要的实际意义。
  本文存在的不足之处是试验数据具有典型性,因为笔者在编程试验时很难找到真实的数据,只能根据其特征来组合,所以试验结果还不能完全说明SVM会在所有的投资决策应用中显示出明显的效果。但是,此次试验证明了SVM在经济领域里有着广泛的应用前途。
  
  参考文献:
  [1]李丽娜侯朝桢:基于支持向量机(SVM)的工业过程辨识.北京理工大学学报,2003年10月
  [2]王小平沈玉娣:支持向量机在轴承故障诊断中的应用.机床与液压,2003.No.4
  [3]姚奕叶中行:基于支持向量機的银行客户信用评估系统研究,系统仿真学报,2004年4月
  [4]姬水旺姬旺田:支持向量机训练算法综述.微机发展,2004年1月
  [5]蓝汉民杨修法:管理会计学.长沙:湖南出版社,1993
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。
其他文献
我国传统医德思想在漫长的医疗实践中形成、发展、完善,是我国医学体系不可分割的组成部分.追溯我国传统医德发展史,强调医乃仁术、天人合一、人际和谐和中庸之道,为现代反思
期刊
营销布局如果在上海时尚新天地逛街,你会发现,法拉利旗舰专卖店是一个富有吸引力的焦点。700平方米宽阔空间的中心位置,迈克尔·舒马赫的一级方程式冠军赛车给人一种猛烈的视
几乎每一个春节长假,网上都会有几个典型的家庭伦理长帖,引得网友搬来板凳嗑着瓜子围观.家庭矛盾各有千秋,是为去谁家过年?是为孝敬爹妈谁多谁少?是为了莫名其妙的夹板气?还
期刊
瑞士是世界钟表的王国,其中的顶级品牌则如王冠上的钻石珍宝,在璀璨的瑞士钟表文化长河中,仍显得熠熠生辉。王冠的饰物自然与拼凑、复制无关,每一个瑞士钟表顶级品牌都有不容
我生在红旗下,长在红旗下,是个土生土长的新疆人,“民族团结一家亲”的意识早已根植于心、融入血脉. 从小我就接触了许多维吾尔、哈萨克、回等各民族的同学和朋友. 工作后,又
期刊
社会不断发展,近年来兴起了共享经济的浪潮,新型交通工具租赁企业在这种背景下顺应而生.本文所指的新型交通工具租赁企业主要讨论的是最具有代表性的共享单车行业.整个行业发
高校图书馆是为广大师生提供信息、知识的重要载体,是他们创作灵感的发源地,也是广大高校师生学习的第二课堂。因此,只有对高校图书馆进行有针对性且有效的管理,才能发挥其最
随着科技的不断发展,在当今社会人们对建筑的各种性能提高了要求,其中之一就是建筑的防雷性能,而这之中,又以高层建筑的防雷技术为重中之重.因为城市化的进行中,很多城市出现
在素质教育全面实施的大趋势下,班级管理中更应当注重班级自主性的培养.本文详细的介绍了班级自主性的概念和意义,并提出了中专学生培养班级自主性的培养办法,希望能够对提高
作为基金从业人员,本不应该有心思阅读这类书籍,因为这两年股市不太好,基金这个行业也不好做。但我仍然认为这本书值得一读 As a fund practitioners, this book should not