【摘 要】
:
20世纪80年代末,数据挖掘作为新兴的研究领域悄然出现。数据挖掘的研究目的是在大型数据集中发现那些隐藏的、人们感兴趣的具有特定规律的信息。随着数据挖掘的发展,这种技术
论文部分内容阅读
20世纪80年代末,数据挖掘作为新兴的研究领域悄然出现。数据挖掘的研究目的是在大型数据集中发现那些隐藏的、人们感兴趣的具有特定规律的信息。随着数据挖掘的发展,这种技术被应用在商业管理、政府办公、科学研究和工程开发等众多的领域中。本文主要关注数据挖掘的一项重要技术——关联规则在股票分析中的应用。首先,本文对数据挖掘和股票做了总体介绍,包括数据挖掘的概念、功能、步骤、股票的背景、基本知识、分析股票的方法和相关软件以及二者的国内外的研究现状;然后,详细介绍了本文的重点,关联规则中经典算法Apriori算法,通过分析Apriori算法存在的两个缺陷(即多次扫描数据库和生成大量的候选集),引入Aproiri_TIDS算法来提高挖掘效率,并针对股票信息的特殊性,阐述了Aproiri_TIDS算法在股票数据挖掘中存在的问题:Aproiri_TIDS算法在数据的预处理和挖掘过程中会导致有效数据的流失,不能结合股票的重要性进行有效的分析等;接着,介绍了本文的核心部分,即从数据信息的新旧、股票的重要性、用户的兴趣三个方面提出了基于权重参数的Aproiri_TIDS优化算法;最后,在对股票代码、交易时间、涨跌幅属性进行数据预处理后,根据Aproiri_TIDS优化算法对股票进行实验验证,实验结果证明改进后的算法所挖掘出的关联规则更加有效。引入权重参数后的算法,在效率上低于原Aproiri_TIDS算法,但是结合用户对挖掘信息的及时性没有很高的要求,改进后的算法完全能满足用户的要求,最重要的是它为用户提供更为全面的、有价值的、用户关注的规则,辅助客户进行决策。
其他文献
2003~2004年在江苏省无锡市进行了水稻实地氮肥管理技术(SSNM)试验.结果表明:2003年和2004年,采用农民习惯施肥法(FFP)的氮素吸收利用率分别为33.7%和34.7%;氮肥生产力1 kg氮
配电网是电力系统的重要组成部分,要高度重视配网工程建设,加大管理力度。10kV配电网是常见的配网种类,应用范围比较广泛,分布点比较多,其安全性和可靠性将关系到人们的正常
藤黄节杆菌(Arthrobacter luteus, A. luteus) ATCC 21606是一种革兰氏阳性短杆状的放线菌。该菌分泌的溶菌酶(Lyticase)能够有效裂解酵母细胞壁,同时它也能分泌限制性核酸内
变截面混凝土箱梁由于具有良好的结构受力性能,近年来得到了越来越广泛的应用。随着跨度的增大,为了抵抗荷载在顶板下缘产生的拉应力,设计者在顶板布置了横向预应力钢筋,但是在这
简要比较了各种不同类型的OPGW光缆的性能特点,并对一种采用复合不锈钢管制造的OPGW光缆的制造要求作一简单介绍。
本文是国家自然科学基金课题《用中间视觉理论研究道路照明安全》(批准号50678180),重庆市建委重点科研课题《主城区道路照明安全与节能性研究》(批准号2007第46号)以及国家
城市化水平高低是一个国家或地区经济、文化发展程度的一个重要标志,一般来说:一个国家或地区经济发展水平越高,其城市化水平越高。世界范围内的经验表明:工业化是城市化发展
现己明确持续性高危型人乳头瘤病毒(Human papillomavirus,HPV)感染是宫颈癌发生的主要诱因,其中由HPV16感染引起的宫颈癌占宫颈癌总数的56%。目前尚无有效的宫颈癌治疗性疫
随着公路桥梁跨度不断增大、刚度降低,公路车桥耦合振动及行车舒适性问题越来越受到重视。本文结合前人研究成果,对桥梁、车辆系统模型、车桥间耦合关系以及车辆行驶舒适度等
家庭式迁移已经成为中国城市化进程中的一个重要现象,而家庭式迁移的农民工不同于个体迁移的农民工,他们在城镇中同时拥有工作和家庭,既要扮演受雇佣者的角色又要扮演家庭成