基于混合概率模型的无监督离散化算法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:ailynn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实应用中常常涉及许多连续的数值属性 ,而目前许多机器学习算法则要求所处理的属性取离散值 .根据在对数值属性的离散化过程中 ,是否考虑相关类别属性的值 ,离散化算法可分为有监督算法和无监督算法两类 .基于混合概率模型 ,该文提出了一种理论严格的无监督离散化算法 ,它能够在无先验知识、无类别属性的前提下 ,将数值属性的值域划分为若干子区间 ,再通过贝叶斯信息准则自动地寻求最佳的子区间数目和区间划分方法 Many real-time applications often involve many continuous numerical attributes, and many current machine learning algorithms require that the attributes to be processed take a discrete value. The discretization algorithm may be based on whether or not the value of the relevant category attribute is considered in the discretization of the numerical attribute There are two kinds of supervised algorithms and unsupervised algorithms.Based on the mixed probability model, this paper presents a rigorous theory of unsupervised discretization algorithm, which can under the premise of no prior knowledge, no class attribute, the numerical attributes Is divided into several sub-intervals, and then automatically find the best sub-interval number and interval division method through Bayesian information criterion
其他文献
武钢烧结厂7800kW风机是烧结车间的核心设备,其风机为无刷电机,利用软启动控制系统,实现风机同步启动,利用SIEMENS公司的PLC完成风机的逻辑控制功能,利用SIEMENS公司的WinCC
近代针灸临床的发展,与"针至病所"的理念密切联系.本文明确地对"针至病的"的理论加以阐述、界定,并作为指导针灸临床及实验的依据.
目的 研究宫颈上皮内瘤变(CIN)患者行锥切术后复发相关因素并探讨可能有效的针对性预防措施.方法 回顾性分析2013年9月至2017年3月湖北省荆州市第一人民医院309例CIN患者临床
一、病例摘要患者,23岁,孕1产0,主因“停经23周,B超提示胎儿左手缺失”于2013年10月6日收入院。患者平素体健,无高血压、糖尿病,否认家族性遗传病史。经营油漆、涂料工作2年
期刊
@@
本文从后评价的角度,按前后对比的思想对公路网规划进行研究,创造性地提出了公路网规划后评价的概念,偿试性地阐述了公路网规划后评价含义、特点、内容、评价指标与评价方法,
糖尿病为内分泌紊乱性病症,近年来发病者有日益年青化趋势,发病率有逐渐增加的趋势,死亡率已上升到继肿瘤、心血管病之后的第三位.糖尿病及其并发症对人类健康的危害是十分严
会议
本文主要研究了含磷化合物对沥青物理、化学性能的影响.经1﹪~3﹪的该化合物处理,沥青针入度减小,软化点升高,粘度增大,同时SHRP高温等级由PG58提高到PG82级.除了价格低廉、工艺
由于光波在不同长度的波导中传输产生的相位延迟不同,特定的波导阵列可以对光波波阵面进行调制。理论推导发现三角形波导阵列可以实现聚焦,得出凸三角形波导阵列聚焦高度和焦
由于全球环保意识抬头,溶剂型接著剂已逐渐被无溶剂之环保型接著剂所取代.顺应国际环保趋势,本研究设计及开发新一代之环保型PUR接著剂与应用技术.环保型PUR鞋用接著剂之接著
会议
1、估值系统稽核。估值系统是基金管理公司中特有的财务计算体系,往往根据具体业务而设计,并一般通过电脑等辅助工具来完成,因其对证券投资参考和财务处理依据起着重要作用,