【摘 要】
:
缺失值插补(missing value imputation,MVI)作为数据挖掘领域的重要研究分支,旨在为机器学习算法的训练提供高质量的数据支持。不同于现有的以算法性能提升为导向的MVI算法,为对大规模数据的缺失值进行有效插补,该文提出一种以数据结构还原为导向的数据分布一致MVKdistribution consistency-based MVI,DC-MVI)算法。首先,DC-MVI算法基于概
【基金项目】
:
国家自然科学基金面上项目(61972261); 广东省自然科学基金面上项目(2314050006683); 深圳市基础研究重点项目(JCYJ20220818100205012);深圳市基础研究面上项目(JCYJ20210324093609026);
论文部分内容阅读
缺失值插补(missing value imputation,MVI)作为数据挖掘领域的重要研究分支,旨在为机器学习算法的训练提供高质量的数据支持。不同于现有的以算法性能提升为导向的MVI算法,为对大规模数据的缺失值进行有效插补,该文提出一种以数据结构还原为导向的数据分布一致MVKdistribution consistency-based MVI,DC-MVI)算法。首先,DC-MVI算法基于概率分布一致性原则构建了用于确定最优插补值的目标函数;其次,利用推导出的可行缺失值优化规则获取与原始完整值保持最大分布一致性且方差最为接近的插补值;最后,在分布式环境下,针对大数据的随机样本划分(random sample partition,RSP)数据块并行训练DC-MVI算法,获得大规模数据缺失值对应的插补值。实验结果表明:DC-MVI算法不仅能生成与原始完整值保持给定显著性水平下概率分布一致的插补值,还具有比另外5种经典的和3种最新的MVI算法更快的插补速度和更好的插补效果,进而证实DC-MVI算法是一种可行的大规模数据MVI算法。
其他文献
在科学技术飞速发展的当今时代,教师需要不断更新模式与方法,以培养出社会发展所需的创新型、实践型人才。传统的以知识传授为主的教学方式已无法满足学生高阶的思维发展需求,促成学生的深度学习成为学科教学的重要任务。根据深度学习理念,教师应改变零散的知识点教学方式,将知识有效整合为有核心概念的知识链,构建有益学生语文核心素养发展的深度教学模式。在此背景下,高中语文新课标明确指出,语文教学应以学科大概念为核心
扜关的位置归属问题历来众说纷纭,有学者主张在巴郡鱼复县,亦有人认为在硖州巴山县,遽难定论。重庆市丰都县出土的一枚汉代“扜关右尉”铜印,根据其他印谱资料和梳理文献典籍中关于“扜关”的相关记载,可以初步确认扜关应在巴郡鱼复县。扜关作为汉初五关之一,兼具民政与军事的双重功能,其军事功能尤为突出,正因如此,掌管武备的关尉出现了左右分置的特殊现象。梳理扜关的基本功能、职官体系与关名流变,对了解古代关津制度有
为顺应当下社会对于复合型人才的需求,中职本科采用了“3+4”分段培养衔接课程体系。本文首先阐述使用这种分段培养衔接课程体系建设的必要性,其次指出当前这种分段培养衔接课程体系建设存在的问题,最后从建设基本原则、建设内容以及建设策略三方面提出了建设“3+4”分段培养衔接课程体系的具体策略。
教研联盟架构起研修体系,通过整合、共享教育资源,以校本教研为基础,以协作体教研促提升,发挥联盟共研作用,助推区域教研均衡发展。在运行机制上自下而上开展教研,在分层教研中优化教研成效,固化教研成果;教研联盟又自上而下形成教研辐射,以哈市研培引领为导向,以名优教师带动区域教师专业成长,以科研课题驱动教研主题纵深研究,教研质量在上下联动中得到螺旋提升。
校本教研是以教师为主体、立足本校、促进教师专业成长的一种有效的教学研究活动,对小学教师的培养具有重要意义。但当今小学校本教研存在着校本教研流于形式、教师主体意识不强、对校本教研没有准确认知、校本教研制度不完善、校本教研中缺少引领型骨干教师等问题。本文通过原因分析,提出具体措施,旨在提高校本教研效能,实现学校和教师的可持续发展。
<正>《朝花夕拾》是现代文学家鲁迅先生唯一一部回忆性的散文集,包含了鲁迅先生在晚年回忆童年时期、青年时期和晚年时期的人和事。“朝花夕拾”的原名为“旧事重提”,以“朝花”喻“旧事”,以“夕拾”喻“重提”,寓意着早晨坠落的花下午捡起来。“朝”“夕”二字不仅代表着字面含义,从艺术语言角度分析,更是鲁迅先生情感和心境的外化呈现,
放缩法指的是借助于不等式所具有的传递性特点,结合所证的目标展开合理放大与缩小的流程.有效地使用放缩法可以调动学生数学学习的积极性,进而加强学生运用数学方法研究与化解问题的能力.本文中以不等式的证明、最值的求解、完全平方数以及不定方程等问题为例,展开放缩法的实际运用分析.
基于2017-2021年招标投标公共服务平台和政府采购网招标中标公告数据,通过2327个全过程工程咨询项目信息,分析全过程工程咨询市场交易现状和发展趋势,并应用企业边界理论进行了简要分析。结果表明,已开展的试点推广工作进展顺利,全过程工程咨询得到长足发展,但服务模式和组织模式还有较大提升空间。今后的研究可借助于交易成本经济学和基于资源的观点等理论,从理论和实践结合角度对全过程工程咨询服务的发展做出
针对膝盖器官组织在多模态图像中存在复杂的粘连和交错叠加的情况,提出在扩散区域增长算法中增加种子亮度限制参数并与边缘限制参数一起共同控制区域增长的迭代过程,该算法和相关的滤波算法通过采用GPU编程方式实现,并将半月板临近组织的分割从股骨和胫骨的最近连接处展开。实验结果表明,本方法对于膝盖组织和相关病灶的分割提供可视的实时显示,对膝盖组织相关疾病的微创手术和介入治疗提供导视。