【摘 要】
:
进入大数据时代,海量数据正以空前的速度产生。这些数据不仅样本数目众多,其特征规模也不容小觑。医疗领域也不例外,如包含数以万计的基因探针的微阵列数据;分辨率很高的X射线、核磁共振等医学影像数据等。上述高维数据不可避免的包含了冗余特征,对分类和聚类算法的学习性提出了许多挑战。因此,本文围绕“医疗大数据特征降维”这一主线开展研究,主要针对分类或者聚类任务,提出了以下三种特征选择和提取的创新方法:(1)一
论文部分内容阅读
进入大数据时代,海量数据正以空前的速度产生。这些数据不仅样本数目众多,其特征规模也不容小觑。医疗领域也不例外,如包含数以万计的基因探针的微阵列数据;分辨率很高的X射线、核磁共振等医学影像数据等。上述高维数据不可避免的包含了冗余特征,对分类和聚类算法的学习性提出了许多挑战。因此,本文围绕“医疗大数据特征降维”这一主线开展研究,主要针对分类或者聚类任务,提出了以下三种特征选择和提取的创新方法:(1)一种有监督的全局互信息特征选择方法。以往的方法都是建立在最大化特征与类别标签的互信息的基础之上,进行启发式的贪婪选择,算法易于受到先导特征的影响。本文使用二次规划模型来建模相关性最大化的目标,并同时考虑特征之间的冗余性,以求取全局最优的特征子集达到精简高维数据的目的。(2)一种有监督的基于l2,1范数的降维方法。考虑到线性判别分析可以有效地揭示数据样本的类内和类间的全局判别信息,Laplacian矩阵可以反映出数据局部流形结构的“平滑”程度。本文将以上二者结合于同一框架之中,辅以l2,1范数保证特征选择的行稀疏性,旨在求取最能够反映全局判别信息和保持局部几何结构的低维线性变换。(3)一种无监督的自适应特征选择方法。本文摒弃了以往利用K近邻结合高斯径向基核函数构造相似矩阵的方法,而是根据距离为每个数据样本点自适应地分配最佳邻居结点。然后将特征选择嵌入到聚类过程中,结合稀疏学习确保选择的特征很好地反映数据流形结构。
其他文献
细粒度图像识别近几年来在计算机视觉领域受到了广泛的关注,其任务是识别在外观信息以及语义信息都非常相似的物体子类,例如识别不同种类的“鸟”:如“棕头鸦雀”、“百耳画眉”,“赤腹山雀”等(或者识别不同种类的车:如“丰田”、“本田”、“路虎”等),具有广泛的应用前景。与传统的图像分类相比,细粒度图像识别的不同和难点在于:一是类间差异非常细微(比如鸟的不同子类或车的不同子类),不同子类对象间的差异主要体现
目标检测是计算机视觉中一项基础关键的任务,在各种商业和军事领域都有着广泛的应用,具有重要的意义。一些应用场景,例如自动驾驶,不仅需要检测出目标在图像中的位置,还需要估计出目标的距离,因此如何高效地检测出目标的位置并且估计出目标的距离成为了一个极具挑战性的问题。多路复用成像设备使用一个感光元件接收并编码多个镜头视角下的画面信息,减少了数据通信和存储的开销。多路复用成像设备往往配有图像重建算法,用来恢
包商银行破产冲击了投资者对金融债隐性担保的预期,本文研究打破同业兑付是否系统性改变同业存单的发行定价。研究发现,包商银行破产后,尽管市场提升了对信用风险的感知,发行主体的评级和银行类型在同业存单定价过程中的作用得到增强,但流动性分层和信用分层的现象也变得更加明显,发行人和债项本身等基本面信息对发行利差的解释力度下降,这事实上恶化了同业存单市场的定价效率。同时,异质性分析表明包商银行事件会加剧中小银
基于三维点云数据的室内场景理解是计算机视觉领域的重要研究内容,它指的是对三维点云数据直接处理,将场景进行语义级别和实例级别的分割。随着三维传感设备性能的不断提高,点云数据的获取也变得越来越容易。有效的点云分割是自动驾驶、机器视觉和遥感测绘等高层次视觉任务的基础,具有广阔的应用前景。本文的主要工作如下:(1)本文提出了一种基于特征选择的点云语义分割技术。由于现有的点云语义分割方法都忽视了特征通道之间
无人机技术的逐渐成熟以及深度学习的迅速发展,使得研发智能化的无人机成为可能。然而,由于嵌入式设备的内存和计算能力有限,通过在无人机平台上部署目标检测进行实时场景解析极具挑战性。现阶段基于深度学习的主流目标检测算法基本可以分为Two-Stage算法和One-Stage算法两大类,Two-Stage算法检测精度高但是检测速度慢,One-Stage算法检测速度快但是检测精度有所欠缺。本文结合这两种算法的
随着无线通信技术的飞速发展,通信系统对天线的小型化、平面化和宽带化的要求越来越高。超宽带通信具有传输速率高、系统容量大、抗多径能力强、功耗低和成本低等优点,而超宽带天线特别是超宽带天线小型化技术成为当前学术界和业界的研究热点同时也是研究难点。另外,在远距离通信系统中需要高增益定向天线,一般采用抛物面天线或微带阵列天线。但是传统的抛物面天线体积较大,机动性差;而微带阵列天线复杂的馈电网络会导致损耗较
从媒体融合被确立为国家战略以来,在政策、技术、环境、市场等综合因素推动下,全媒体已成为媒体融合在新时代的重要特征。本文从观念更新、互联网思维、流程优化与平台再造、智慧广电、经营管理和复合型人才培养等方面探讨了全媒体环境下广电媒体融合发展的趋势和路径问题。
2020年疫情突袭,我们看到了生命的渺小和脆弱。疫情背后,也让我们看到了一些人对生命的漠视。在此,我们不得不重新审视儿童的生命教育。统观学校课程,有国家课程、地方课程、校本课程。开设的课程中,唯独没有专门的生命教育课。老师始终坚持学科知识本位,关注的永远是分数,学生的心理健康教育、生命教育、责任教育、规则教育、爱的教育等公民意识教育,往往是蜻蜓点水式地走过场,流于形式。再看身边的家长,关心的
毫米波雷达在近程探测方面应用广泛,有着抗干扰能力强、精度高、体积小等特点。本论文以3mm近程雷达探测系统为研究对象,主要研究了LFMCW雷达在多目标检测中的离散频谱估计算法和频域配对算法。最后结合需求,设计出一种LFMCW近程多目标检测系统。研究的主要内容如下:(1)分析了雷达系统的结构,研究了典型LFMCW雷达的工作信号,给出了雷达探测精度的影响因素。(2)针对频谱的栅栏效应造成的探测精度下降,
随着Android系统的迅速普及,Android恶意应用软件成为了人们日常生活中的严重威胁。虽然近年来研究者们提出了许多方法和工具来对Android恶意应用软件进行检测与防御,但是大多数的方法都聚焦于恶意应用粗粒度的检测,无法更准确的考虑到具体的恶意行为类别。本论文从静态分析的角度入手,在Android应用中提取行为特征,将恶意应用根据其实施的恶意行为进行分类;并考虑对抗环境下检测方法的适用性,研