基于集合卡尔曼滤波的SVM参数优化方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:xia__1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)是常用的机器学习算法。实现性能最优的SVM模型需要进行参数优化,这里的参数包括SVM算法的超参数、数据特征权重、训练过程中的Lagrange乘子,以及模型阈值。随着数据规模增长,给SVM应用带来挑战。为此,论文提出集合卡尔曼滤波(En KF)算法用于参数优化和特征优化,提高SVM优化效率和模型性能,En KF算法主要用于地球科学领域的数据同化。同时,根据SVM模型训练和参数优化特点,提出级联式技术用于加速SVM在参数优化过程中的模型训练。此外,论文以引力波噪声事件分析为主要应用对象,提出分层模型和ROC块算法,提供SVM模型的分类性能。论文工作包括:(1)提出基于En KF的SVM超参数优化方法。该方法包含多种优化技术,其中多集合用于避免局部最优,集合进化用于扩大搜索范围,集合归并算法用于提高集合表示能力,基于Householder变换的UR分解方法降低En KF计算开销。在此基础上建立En KF优化框架。实验结果表明,在限定参数采样条件下,与现有的三种贝叶斯优化算法比较,En KF方法优化效果更好。(2)提出基于En KF的特征选择和特征加权方法。针对高维空间,提出混合策略,采用过滤式技术进行降维,并且指导集合生成,同时建立两阶段的集合进化流程提高搜索效率。此外,En KF方法能够同时处理参数优化和特征优化。实验结果表明,在限定参数采样条件下,En KF方法能够大大减少特征数量,同时在一些数据集上实现性能提升。(3)提出级联式加速技术用于降低SVM在超参数优化过程中的训练开销。该技术利用低效维度特性,在不同训练任务之间建立级联,将已有模型结果作为初始条件用于SVM模型训练,减少计算过程中工作集选择。实验结果表明,在网格搜索中SVM的计算开销降低29.6%到84.5%,其它优化方法中SVM的计算开销平均降低21.9%到62.7%。(4)提出SVM分层模型用于引力波噪声事件分析。该应用为代价敏感的二分类问题。该模型基于非平衡树结构,通过逐层分类对噪声事件进行识别。同时,提出ROC块算法用于模型阈值选择和模型性能可视化。实验结果表明,在给定误警条件下,分层模型能够提高大约10%的识别性能。
其他文献
随着工业、农业生产规模的逐步扩大与蓬勃发展,菊酯类杀虫剂(PPs)和酚类内分泌干扰物(PEDs)残留对人类健康和生态平衡造成的危害愈加严重,研究表明PEDs污染物对人类和动物生
受传统的“满堂灌”教学模式的影响,教师成为传授知识的机器,学生也被视为接受知识的容器。本来应该充满乐趣的小学数学课堂,被教师演绎的枯燥、乏味,小学生学习兴趣欠佳,当然课堂
随着医疗市场的逐步开放,私立医院和外资/合资医院给公立医院的传统管理模式带来了很大的冲击。企业识别系统(corporate identify system,CIS)已逐步应用于医院文化建设,起着“
目前,粉末静电喷涂新技术,由于其明显的优越性而正在得到大力推广,使用的场合和范围正在迅速扩大。不管底材为有色金属还是黑色金属的零件,不管是铸件,还是冲压件,都可以进行
矩阵作为高等代数这一伟大数学图腾重要分支的一大重要部分,在我们的生活,学习,工作,更是在人类的进步中发挥了卓越的工具作用。可逆矩阵是矩阵知识的一个基础支流,作为矩阵
目的:观察埋针疗法配合艾灸治疗对改善THA术后疼痛及关节功能的临床疗效。方法:将64例THA术后患者,随机分为对照组32例,术后仅予艾灸治疗干预组32例,予艾灸联合埋针疗法。结
目的研究FasL基因修饰后的树突状细胞(DC)的表型和功能的变化。方法以含小鼠FasL(mFasL)基因的重组真核表达载体转染小鼠骨髓来源的DC,FACS法检测DC表型的变化。将转染后DC与T细胞
住院医师规范化培训与临床专业学位研究生培养并轨模式是医学教育改革和卫生体制改革的重要进展。任何新事物的产生均伴随着争议和考验。笔者从住院医师的角度调查分析青年医
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
镇村体系的研究是进行农村社区规划的一项重要的基础性工作。以安沟乡为例,运用社会网络分析法对黄土丘陵沟壑区镇村之间的人际联系强度与趋向进行分析,根据人际联系强度的空