序列数据挖掘的模型和算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:fky12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短短的几年时间,数据挖掘风靡全球,成为 IT 业近年来非常热门和前沿的研究方向之一,由于数据挖掘融合了人工智能、统计学、数据库、机器学习等各个领域的理论与技术,使得不同学科领域的学者对 DM 的研究表现出了前所未有的热情和参与精神,在世纪交替的特殊时期,这是又一轮规模空前的学科大融合。 数据挖掘目的是在大量的数据中发现令人感兴趣的模式,用以认识规律,提高效率,预测未来,其核心技术具有很大的挑战性,由于数据的适时性和时间特征,诸如Web 挖掘、金融挖掘、电子商务和市场调查等不可避免的会面临序列数据的处理,其中以时间为序的又称为时间序列,因此序列数据挖掘就应运而生了,但和目前其它分支不一样的是这方面的研究对模型的依赖严重得多,而众所周知时间序列分析在统计中就以复杂和抽象著称,尤其是涉及到另一个挖掘中困难的课题:异常挖掘,并且还要考虑序列中的异常挖掘,即使在统计学中也是非常艰难的,至今并没有很好的解决方案。金融数据挖掘是另一个非常困难的方向,虽然金融数学提供了丰富的理论和方法,但很多方法太抽象,实证效果也并不理想,作为普及方法推广是不现实的,数据挖掘作为 IT 技术,简单快速是必不可少的,因此更多的从模型出发、以算法为基础,建立切实可行的序列数据挖掘技术和理论体系是本文的目的。 我们在第一章的绪论中除了介绍相关的概念、基础知识和国内外研究现状外,介绍了统计中非常实用的线性模型方法及在序列数据挖掘中的应用。 第二章主要研究了线性模型的参数估计方法,得到了很多非常深入的新结果。 第三章主要介绍了数据的可视化和序列数据的聚类研究、线性模式挖掘和异常挖掘,同时应用于证券数据的挖掘,取得了不错的实证效果。 第四章我们主要研究了序列数据挖掘的预测问题,同样在证券实证分析中获得有力的支持。 第五章针对实际更多出现的数据缺失深入研究了 EM 算法等数据修补技术和插值技术,结果非常令人满意,最后进一步研究了向前搜索算法,通过聚类的预处理,既节约时间又避免错误的发生,效果也比较理想。 序列数据挖掘的广博领域显然不是本研究所能穷尽的,我们在文末展望了该方向今后的发展和进一步有待研究的若干问题。
其他文献
为了了解医学生的医疗风险认知状况,以探讨其风险意识、相关知识技能储备及对医疗风险防范情况,本文采取随机抽样方式进行调查,发现医学生在医疗风险范围、引发因素、转移与
加强公共卫生建设是保护和发展社会生产力、构建和谐社会、建设现代化的重要内容,应对突发公共卫生事件则是加强公共卫生建设的重要环节.本文从突发公共卫生事件的特点着手,
中缅油气管道(缅甸段)地质条件复杂,管道穿越若开山区和缅北高原,由于建设期大面积扰动地表,改变了原始地貌,铺设管道后重新回填的土体力学强度低、水敏感性强,受汛期强降雨
责任竞合根源于规范竞合,是一种普遍存在的现象,其法律效果是多重请求权的行使。本文结合两个案例.阐释了责任竞合的法律内涵及责任竞合时伤残鉴定的现状,并从统一鉴定标准和统一
为了解临沂地区植物寄生线虫分布情况,2007年在临沂地区开展了植物寄生线虫调查,调查中发现了拟滑刃属三个种.伞菌拟滑刃线虫Aphelenchoides agarici具有口针基部加厚;侧线3
生物认证技术是根据人体生理和行为特征来识别或验证一个有生命的人的自动方法。独特性和稳定性这两个特征一起使得虹膜成为一种极好的生物特征,从而提供了一种最准确的生物
为进一步提高《医学与法学》期刊的办刊质量,努力推进创办核心期刊的工作,2014年7月10-16日,我刊主编程文玉教授、执行主编石俊华教授、编辑部副主任王海容老师等三位同志参加了
期刊
“不抑兼并”始终是宋代土地政策的大方向,它造成了兼并之事实;然而,“不抑兼并”并不意味着放任兼并或者可以任意买卖土地,而必须以合法为前提。政府始终发挥其主导作用,用