论文部分内容阅读
机器学习算法在中药成分分析,成分与疾病关系的研究中一直起着重要的作用。利用机器学习技术对中药成分进行发掘是中药现代化的重要方法。本文主要研究几种机器学习算法的改进,并分析它们在中药成分分析,成分与证候的关系中的应用。
本文提出了一种根据疾病的历史记录提取成分对应的疾病集合和频次以及TF-IDF权重的计算方法。接着本文提出了中药成分之间的相似度计算的计算方法。并改进了K-medoids算法,然后分析了改进的K-medoids算法在中药成分聚类分析中的效果,最后给出了聚类分析的评价方法。
本文提出一种基于中药成分IDF值的黑名单算法。并介绍基于中药成分IDF的黑名单算法在中药成分分析研究中的应用。此算法在提高黑名单的自动化,可解释性以及降低数据量和减少冗余信息方面的效果取得了一定成果。
协同过滤(CF)是最成功的推荐系统的方法之一。本文提出了一种改进的概率矩阵分解的模型。接着分析了改进的非负概率分解,以及这些模型在MovieLens数据集的实验结果。并比较几种算法之间的优劣。最后本文提出一种可行的改进的概率矩阵分解模型在中药成分和证候的关系预测和分析中应用的方案。