【摘 要】
:
大数据背景下,庞大复杂的样本往往来自很多种类或分组.有限混合模型正是刻画这种异质性的有力建模工具.对混合模型中的数理问题进行研究,是很多应用展开的首要任务,其意义重
论文部分内容阅读
大数据背景下,庞大复杂的样本往往来自很多种类或分组.有限混合模型正是刻画这种异质性的有力建模工具.对混合模型中的数理问题进行研究,是很多应用展开的首要任务,其意义重大.本文对有限混合模型的两个问题进行研究.第一个问题是在给定混合模型的成分个数的条件下,对模型参数进行估计.另一个问题则是在成分个数未知情况下的模型选择,即混合模型的定阶.针对第一个问题,文章提出了三种改进的期望最大化算法(expectation-maximization algorithm,EM算法),用于对有限混合模型进行参数估计.具体地,在E步给定观测数据及当前参数估计值,计算隐变量的条件期望时,对混合比例进行不同形式的修改.改进的算法保持了经典EM算法的收敛性.基于模拟数据以及真实数据的实验结果均表明,三种改进EM算法的收敛速度比经典EM算法更快,同时对有限混合模型的参数估计效果更加准确和稳定.针对第二个问题,本文在惩罚对数似然函数中引入MCP罚函数(min-imax concave penalty),提出了 MMCP 方法.具体地,该方法在对数似然函数的基础上引入两个惩罚项,分别对混合比例和成分参数的距离进行惩罚.MMCP法能够同时实现混合模型的定阶及其它参数的估计.数值实验结果表明,相比MSCAD方法,MMCP方法对混合模型的定阶准确率更高.
其他文献
盐穴地下储气库作为重要的储气调峰手段,具有事故突发性强、破坏性大、影响范围广,且易引发次生灾害等特点。与国外的储气库相比,我国盐穴储气库的地下储备条件相对复杂,其盐
对流层延迟是GNSS定位的主要误差来源,通常的经验模型精度较低,难以满足实时精密单点定位的需求。基于实时基准站观测数据,构建广域实时高精度对流层模型具有重要意义,同时也
值戊戌变法120周年之际,对康有为科学思想等核心理论进行深度探析具有重要意义。康有为是清末民初动荡时代深刻思考儒学与西学,儒学与科学关系并提出一整套解决方案并企图改
改革开放以来,我国中小微企业迅速崛起,并逐步成为带动经济发展的一支主力军。在2018年北京召开的国务院促进中小微企业发展工作领导小组第一次会议中,对当前中小微企业在中国经济中的作用做出明确表述,并用了“五六七八九”来进行概括。即中小微企业贡献了50%以上的税收,60%以上的GDP,70%以上的技术创新,80%以上的城镇劳动就业,90%以上的企业数量,是推动经济实现高质量发展的重要基础,也是扩大就业
美国在防止利益冲突方面采取了许多有效的措施。其具体方法包括财务公开、政务公开、信息自由、离职后行为限制、保护知情举报人等。美国防止利益冲突的启示:注重理论分析与国
近年来,我国城镇小学生课外补习现象越来越普遍,课外补习现象不断升温。与此同时,随着农村市场经济的发展,家庭生活水平的提高以及农村人们教育观念的转变,同时受以围绕升学考试分数为目的的应试教育的影响,以培优补差为目的的课外补习逐渐渗透到农村教育市场。与之相适应地,对课外补习的需求也就越来越多样化和扩大化。因此,有必要对当前农村高年级小学生课外补习的状况进行研究,分析现阶段农村地区课外补习存在的问题和原
工业园区因物质能量的高度集聚,生产—消费过程的网络关联,以及区域示范带动效应,在循环经济发展中受到持续关注。本研究以福建省蛟洋循环经济示范园区为例,应用物质流、生态