几种机器学习算法的改进及其在中药成分分析中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhangwahaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法在中药成分分析,成分与疾病关系的研究中一直起着重要的作用。利用机器学习技术对中药成分进行发掘是中药现代化的重要方法。本文主要研究几种机器学习算法的改进,并分析它们在中药成分分析,成分与证候的关系中的应用。   本文提出了一种根据疾病的历史记录提取成分对应的疾病集合和频次以及TF-IDF权重的计算方法。接着本文提出了中药成分之间的相似度计算的计算方法。并改进了K-medoids算法,然后分析了改进的K-medoids算法在中药成分聚类分析中的效果,最后给出了聚类分析的评价方法。   本文提出一种基于中药成分IDF值的黑名单算法。并介绍基于中药成分IDF的黑名单算法在中药成分分析研究中的应用。此算法在提高黑名单的自动化,可解释性以及降低数据量和减少冗余信息方面的效果取得了一定成果。   协同过滤(CF)是最成功的推荐系统的方法之一。本文提出了一种改进的概率矩阵分解的模型。接着分析了改进的非负概率分解,以及这些模型在MovieLens数据集的实验结果。并比较几种算法之间的优劣。最后本文提出一种可行的改进的概率矩阵分解模型在中药成分和证候的关系预测和分析中应用的方案。
其他文献
每一个网站(又称为数据源)都会提供一些数据值集合,用来反映事实信息,例如一个网上书店,它会提供很多书的信息,包括作者、书名、出版社和书的价格等。那么这些数据值就对应着一个集
内存资源是虚拟化技术管理的重要资源之一,对虚拟化系统的性能影响很大。目前,虚拟机在启动之前都会配置一个内存上限,该内存上限在虚拟机运行过程中不可更改。然而,虚拟机上运行
目前,越来越多的混合应用出现在了各大Android应用市场中,根据IDC的数据统计显示,截至2016年第三季度,Android占据了智能手机操作系统份额的86.8%。这些应用包含了 Android原
畜产品溯源系统的建立是保证畜产品质量的有效做法,它的建立与运行一般会涉及到RFID技术,用电子标签附在要识别的牲畜上记录牲畜从生产到消费各环节的信息,用RFID阅读器来读
随着无线通讯技术以及位置服务的发展,移动对象的数据管理逐渐成为研究热点。近年来,国内外一些学者针对不同实际应用,在基于R树的移动对象索引方面进行了大量的研究,提出了一系
随着计算机交互、多媒体等信息技术的蓬勃发展,情感处理目前已经成为人工智能领域内一个新的研究热点。音乐作为多媒体技术的重要组成部分,对于计算机音乐情感信息的分析受到了
互联网的发展个我们带来更多资讯的同时,也使得程序设计类课程中的抄袭行为更加普遍。程序设计是高等院校计算机专业教学中不可或缺的实践与教学环节,程序设计语言类别也是多种
Web2.0的主要特点是用户创造内容。社会标注系统因为具有入门低、操作灵活、简单易用等优点而逐渐成为Web2.0环境下的最热门应用。社会标注技术有助于提高信息检索的质量,使用
虚拟试衣是计算机技术发展延伸到日常应用的典例。在网络购物越来越流行的今天,虚拟试衣系统可以为购衣者提供更加便捷的服务。   本文开发了一套三维虚拟试衣系统。使用
随着互联网技术的快速发展,网络中的图像资源也得到爆发式的增长,因此如何迅速的在大量图像资源中找到用户所需资源逐渐发展成为一个重要的问题。另一方面,随着基于内容的图