【摘 要】
:
为了解决传统基于同源序列比对的抗性基因识别方法中假阳性高、无法发现新的抗性基因的问题,提出了一种利用随机森林分类器和K-Means聚类降采样方法的抗性基因识别算法。针对
【机 构】
:
哈尔滨工业大学计算机科学与技术学院,厦门大学信息科学与技术学院
论文部分内容阅读
为了解决传统基于同源序列比对的抗性基因识别方法中假阳性高、无法发现新的抗性基因的问题,提出了一种利用随机森林分类器和K-Means聚类降采样方法的抗性基因识别算法。针对目前研究工作中挖掘盲目性大的问题,进行两点改进:引入了随机森林分类器和188维组合特征来进行抗性基因识别,这种基于样本统计学习的方法能够有效地捕捉抗性基因内在特性;对于训练过程中存在的严重类别不平衡现象,使用基于聚类的降采样方法得到了更具代表性的训练集,进一步降低了识别误差。实验结果表明,该算法可以有效地进行抗性基因的识别工作,能够对现有实验验证数据进行准确的分类,并在反例集上也获得了较高的精度。
其他文献
<正> 眼部护肤品的主要成分和作用有以下几方面: 活性酶——Q10的混合品,使用后能改善松弛的皮肤,消除眼袋的黑眼圈,让眼圈肌肤更加滋润。活性乳。至少有56种生物活性乳,它们
药品从生产企业到消费者手里,医药营销渠道发挥了不可忽略的作用。我国落后的药品销售渠道致使零售终端药价过高,给消费者带来很大负担,不利于我国药品市场的发展。加入WTO以
0前言碱性镀锌是一种应用广泛的工艺,其具有成本低、镀液成分简单(不含配位剂)[1]、废水易于处理、镀层与基体结合力好、细致光亮、韧性好、经钝化处理具有很好的耐蚀性和装饰
受时代风尚影响,变异语词修辞现象大量涌现,不断地丰富着现代汉语的语词修辞方式,也满足了不断深化的表达需求。从语词变异使用对常规的突破点和特殊效应的侧重点来分析,语词的变
<正>克州是个半农半牧的自治州,农业和畜牧业是全州的主要经济支柱。克州畜牧业历史悠久,地域辽阔,天然草地资源丰富,现有牧草面积447.05万亩,具有发展畜牧业的绝对优势。然
针对目前图像融合信息不完整,融合结果对比度不高的缺点,提出了一种基于模糊算子的Tetrolet变换图像融合算法。将源图像经过改进的Tetrolet变换,得到高频系数和低频系数;对于
作为东亚货币与金融合作的重要组成,汇率协调往往被认为是促进区内贸易整合的关键举措。但相关理论与实证研究显示,汇率波动与贸易的关系并不明确。通过对1996-2011年间中国
谷氨酰胺转胺酶可以催化蛋白质分子内或分子间的酰基转移反应,通过形成的交联键改善蛋白质的功能性质。本文介绍了谷氨酰胺转胺酶的特性、作用机理及其在肉制品中的应用。
随着人们生活居住条件的改善,对居住环境提出了更高的要求,而居住区园林化是改善居住环境的必然趋势,因此加大居住区绿化,配置合适的植物,是创造富有情趣的居住区的必要措施