带置信度分类器的研究与应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:Zeshawn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高风险领域的分类问题对模式分类算法提出以下三个挑战:1)能否设计一种分类器模型,使得它的输出结果能够附带置信度;2)预测输出的置信度是有效的,应该使得算法的准确率能够被置信度所控制。3)算法应能够独立地对每个测试数据提供相应的置信度评估,也就是说,能够根据指定的置信度产生相应的预测结果。针对上述三个挑战,我们引入了基于转导推理和随机性检验的置信预测方法来解决这些问题。近年新发展起来的一致性预测器(CP)是这种方法的典型代表。但是,CP在实践中的实用性较差,主要是其固有的运算效率低下、以及对样本奇异函数的设计缺乏指导性准则。我们的工作主要是改进了CP的理论模型,提出了混合压缩一致性预测器(HCCP)的算法框架及其实现技术,使其更适合于实际应用。HCCP在预测性能与计算效率间取得了一个较好的折衷,它在处理大数据集学习问题时,在保持算法的预测效率的同时大大提高了CP的运算效率。HCCP的运作特点是将用于学习的样本序列划分成两个部分,并采用两阶段混合压缩:第一阶段先将前一部分序列样本压缩成一个模型,并以知识的形式保存;第二阶段再将上述知识传递给后续的检验样本序列用于置信预测。在算法实现技术方面,HCCP采用有监督的度量学习方法来实现有效信息在两个子序列(训练样本序列和检验样本序列)中的传递。并分别通过有监督核学习方法(HCCP-KerNN)和随机森林技术(HCCP-RF)实现了度量学习和样本奇异函数的设计。我们还从实验角度展现了HCCP-RF算法在田纳西-伊斯曼化工过程(TEP)这样的流程工业大系统的在线故障置信检测中的适用性和有效性。针对小数据集的学习问题,我们也提出了一种无划分的HCCP-RF算法,它取消了对学习样本集的划分,更加适用于处理小样本数据。通过对慢性胃炎中医诊断数据集的实验,验证了该算法的有效性。最后,对本文的工作进行了总结,并对今后的研究工作提出了展望。
其他文献
流动性过剩在我国虽然具有总量上的特征,但实质上却具有区域性的差别。因此当前统一的货币政策便面临着一个两难的问题。故应该实行差异化的货币政策和相与之适应的经济政策
随着盾构法的发展成熟,其已经成为我国城市地铁隧洞的主要施工方法,在输水隧洞工程中也得到了尝试性应用。为进一步推动盾构法在输水隧洞工程中的应用,本文首先分析了基于盾
随着汽车行业的快速发展,汽车销量有了爆炸式的增长。但是在行业发展的同时,作为汽车产业薄弱环节的汽车营销行业,也凸显出很多问题,这些问题已经成为制约汽车产业发展的瓶颈
<正>组织管理观决定了人们如何进行管理活动,如何看待管理。回答管理是什么,这样的问题就是管理观的问题。应该可以这样说,有了清晰的管理观,才会有清晰的管理行为,也才会有
耙子叔今年70多岁,在农村干了一辈子活,如今眼不花,耳不聋,劲头足。他的两个女儿出嫁了,大儿子早年在建筑工地上打工,从高架上摔下来,死亡事故处理定性为违章作业,老板象征性给了3万
针对大惯性工业对象,设计了一种新的自适应PID调节器控制算法并应用于工业加热炉温度控制系统中,利用改进的Z-N算法,完成PID参数的初始值设定,利用测量误差改变调节器步长的方法实现PID参数的自动整定.实验结果表明,当实际温度距标定温度30℃时,利用这种PID参数自整定算法进行控制,可以使温度控制曲线在不同的阶段平滑过渡,使升温曲线平稳地过渡到恒温阶段.从控制结果上参数自调整PID控制结果几乎没有
电子跃迁吸收能是分子的一个重要的物理属性,它包含分子的内在结构信息和电子性质,所以精确地预测吸收能是计算化学领域的一个重要问题。量子化学方法已经超过了仅仅验证实验值
在生物界中,气味或信息素被广泛用来寻找配偶、搜寻食物、进行交流、躲避天敌等。受生物嗅觉的启发,从二十世纪九十年代开始,一些学者就开始研究使用配置有气体传感器的移动
大脑是最复杂、最完美、最有效的一种信息处理机制,当今人们正以极大的兴趣研究它的结构和机理。这种研究正酝酿着重大的突破,这种突破将给整个科学的发展带来巨大而深远的影响
状态估计不仅是现代决策和控制理论的重要分支,也是保证业务流程安全性和经济性的重要先决条件。21世纪的控制系统是网络、通信与控制相结合的系统。然而,在网络化控制系统(N