BP算法并行化及在数据挖掘中的应用研究

被引量 : 0次 | 上传用户:qoqwryi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了商业智能的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注。数据挖掘是一个决策支持过程,技术基础是人工智能。目前数据挖掘主要利用人工智能中的一些的算法和技术,包括人工神经网络技术等来进行预测、模式识别、分类和聚类分析。本文主要针对神经网络作为数据挖掘的一种手段,在商业行为趋势预测方面的应用研究。BP(Back Propagation)算法, 即误差反传训练算法,以其良好的非线形映射逼近能力和泛化能力以及易实现性成为人工神经网络应用最广泛的训练算法。但是BP算法也有其明显的缺陷,即训练速度慢、容易陷入局部极值等。通过反复的实验研究和分析发现,通常为了避免初始权值过大,导致训练伊始就使网络处于S型函数的饱和区,使训练陷入局部极小,在选取初始权值的时候,通常选取较小随机数。如果选取的权值范围距离目标极值区域很远,搜索空间越大,目标极值区域越窄,搜索时间就越长,训练速度就越缓慢。针对这种情况,本文提出了首先通过不等量划分权值搜索空间获取全局最小极值区域,在此基础上均衡分配训练样本集进行并行训练的二次并行搜索策略,实验证明这种新的并行算法能在迅速找到全局最小的基础上大大提高收敛速度,得到优于一般并行算法的加速比。此并行算法实现简单有效,能更好地应用于现实问题。本文选用通过商用网络连接起来的PC机,以及并行虚拟机PVM和分布式操作系统LINUX,共同构成了一个机群系统作为并行计算平台。在并行程序的模型上选用了Master/Slave模型。算法并行化方式采用了将训练数据平均分配到各节点机的数据并行方式。 最后,讨论了BP算法在数据挖掘中的应用。将此策略应用于医药物流系统的销售预测,建立了基于并行BP算法的物流销售预测模型。本文详细地讨论了销售预测模型的样本的选择和预处理方法、网络拓扑结构的选定,如输入输出层以及隐含层数和隐含层节点数的选择、网络参数的选择等。最后实现了一个可视化的预测系统,可以在此基础上方便的选择不同训练集重新训练网络,并将训练好的网络用于真实的销售趋势预测,取得了令人满意的效果。
其他文献
目前学界对习近平关于新闻工作重要论述的研究已渐趋热潮与渐入佳境,从研究产出看,相关探讨"做好舆论引导工作,一定要把握好时、度、效"与"党性与人民性从来就是一致的"等议
目的探究肠易激综合症患者采用针灸的治疗方法和效果。方法选取2014年3月~2015年8月收治的66例肠易激综合征患者进行治疗,随机分组,实验组39例患者选择针灸治疗,对照组27例患
<正>复数的基本概念、复数相等的充要条件以及复数的代数运算是高考的热点,并且一般在前三题的位置,主要考查对复数概念的理解以及复数的加减乘除四则运算,难度较小.下面对复
<正>(一)流行病学本病可发生于不同年龄、不同性别的猪,但其它家畜未见感染该病。虽然猪气喘病一年四季均可发病,但在冬春季节,气温变化大、寒冷潮湿的环境多发。养殖密度大
<正>“慢亭过客”袁于令,在《西游记题辞》中指出: 文不幻不文,幻不极不幻。是知天下极幻之事,乃极真之事;极幻之理,乃极真之理。
<正>二十世纪末至今,全球性经济犯罪和会计舞弊问题逐渐引人关注,并且经济犯罪在会计领域的集中表现是会计舞弊。美国的雷曼兄弟破产报告中,通过大量令人眼花缭乱的会计手段
目的:观察豁痰化瘀法及结合针灸结合治疗主观性耳鸣的疗效。方法:将知情同意的患者用SAS软件随机分为耳聋左慈丸组、中药组、中药加针灸组,每组20例共60例入选。结果:经统计
<正>一、引言现代服务业对会计行业、会计人员的素质和能力要求越来越高,会计岗位人才至少应具备以下职业能力:具有较高的职业判断力,能在综合各种信息和知识的基础上,选择合
<正>引言在科学研究中,常常需要对反映事物属性的多个变量进行大量的观察,收集大量数据。多变量大样本无疑会为科学研究提供丰富信息,但同时也给数据处理带来了困难。特别是
目的:观察脂肪肝患者治疗过程中肝脏的声像图变化。方法:22例患者经B超检查提示为脂肪肝,经过饮食调理或运动训练3个月~1年后,再次行B超检查,两次B超结果进行对比观察。结果: