基于图像相似度学习的单细胞聚类研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ysgmxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细胞是所有生命活动最基本的单位,它的结构与功能一直是科学家们的研究重点。每一个细胞都是独一无二的,它们在特定的位置上完成着特定的功能。之前大多数的基因测序都是针对于整块组织样本或细胞群,这样测量得出的平均基因表达量可能会掩盖细胞间的差异。为了更好地在细胞基因层面上进行研究,单细胞测序应运而生。单细胞测序可以通过仪器测量出每个细胞中每个基因的表达量,这样研究人员可以在单个细胞粒度上进行分析。由于目前技术的限制,单细胞RNA测序数据仍然存在很多问题,比如维度较高、误差较大、数据稀疏等,这些问题会对后续的分析造成一定影响。鉴于聚类是对单细胞数据集进行分析的重要方法,本文结合集成学习与自监督学习两种方法探索出准确度更高的单细胞聚类方法。本文提出一种基于集成学习的单细胞聚类方法。首先,本文首次把单细胞表达谱数据通过2D嵌入转换成为二维图像数据,随后构建一个无监督深度神经网络模型对数据降维后利用谱聚类完成聚类,接着使用集成学习综合几种单细胞聚类算法的结果生成聚类矩阵。之后,利用聚类矩阵的结果构建网络并对其进行社区发现得到结果。在多个单细胞数据集的实验结果表明基于集成学习的单细胞聚类方法在聚类性能指标ARI和NMI上都取得最高性能表现。通过集成学习融合多个单细胞聚类算法的结果可以在一定程度上提高聚类的性能,但是这种方法并没有考虑到有些细胞对在分类中是否稳定。为了进一步提高聚类效果,本文从聚类稳定性入手挑选出较为稳定的样本并作为带标签数据,而聚类稳定性较低的样本则作为无标签数据,然后构建一个自监督学习模型将得到的数据作为输入并完成特征的提取最后聚类。此外,为了清晰且直观地展示最终的聚类结果,本文将根据自监督网络提取的特征和聚类结果绘制出数据集对应的相似性热图并利用t-SNE方法对结果进行可视化。从最终的聚类性能指标ARI和NMI上看,基于自监督学习的单细胞聚类算法在之前方法的基础上有一定的提高,证明此算法的设计是合理且可行的。
其他文献
糖尿病肾病(Diabetic kidney disease,DKD)是糖尿病(Diabetes mellitus,DM)最常见的微血管并发症之一。如果不加以治疗,患者最终发展成终末期肾病(End-stage renal disease,ESRD)。肾小球的纤维化是DKD主要的病理特征,在纤维化的过程中人肾小球系膜细胞(human mesangial cells,HMCs)外基质堆积被认为是纤维化的
学位
背景:RhoA-ROCK通路介导了神经细胞的许多生理和病理过程,如细胞的伸展、收缩和损伤后再生长相关过程均受到此通路的调节。有研究表明Rho A-ROCK通路的抑制,可促进神经细胞的生长,并且ROCK2起到了主导的作用。最新研究表明,H2S通过促进Rho A的磷酸化,对缺血性脑损伤起到了保护作用,但未明确H2S和ROCK2蛋白之间的具体机制。H2S能否对ROCK2的磷酸化修饰产生影响,以及此修饰对
学位
近年来,以人工智能为代表的计算机技术在实际应用中逐步推广,使得零售行业发生巨大变化。尤其是人脸识别、移动支付、云计算等技术的普及,催生了无人便利店、无人自动售货机以及无人售货架等三种主要的新型消费形态,亦即人们常说的“无人零售”。当前,在新冠疫情的冲击下,无人零售的智能化、便捷性和无接触等特点使其逐渐得到大众的认可。但是,当前公开的无人零售数据集较少,因此需要实现图像的快速采集。同时,一些无人零售
学位
目的:本研究的目的是评估Rg1对T2DM小鼠认知功能障碍的保护作用,并探究其对神经炎症、神经元损伤和钙稳态的影响;其次探讨TRPC6敲除对T2DM小鼠认知功能障碍的影响。方法:1.本实验采用C57 BL/6小鼠,分组为正常对照(Control)组,高脂饲料喂养对照(HFD)组,模型(HFD+STZ)组,人参皂苷Rg1(1 mg/kg,5 mg/kg和10 mg/kg)3组,阳性药对照二甲双胍200
学位
随着互联网和多媒体信息技术的发展,每时每刻都有巨量的数字信息在互联网上传播。由于数字图像能够直观、生动形象地表现信息,数字图像成为人们互相传送信息的主要媒介之一。数字图像往往具有很大的数据冗余性,且部分图像包含大量隐私或者机密信息,因此如何保证数据安全性并提高数据传输效率得到广泛的研究。压缩感知,作为一种能以低于奈奎斯特采样定律进行采样的技术,已被广泛应用到当前的图像压缩加密研究中。然而许多现有的
学位
一直以来,拥有一个能够与人类进行交流,完成人类通过语言下达的任务的通用机器人是人类的梦想。而现在,计算机视觉以及自然语言处理等领域的研究取得的巨大突破,让这个梦想逐渐变为现实。视觉语言导航(Vision-andLanguage Navigation)任务被认为是实现通用机器人的基础性任务,在该任务中,智能体接收关于导航路径的自然语言指令,并在指令的指导下自主行走到目标点。该项任务的难点在于理解非结
学位
背景肝细胞癌(Hepatocellular carcinoma,HCC)是病死率较高的恶性肿瘤之一。HCC由各种复杂的危害因素引发,多形成于慢性肝病或肝硬化的基础上。目前,针对肝细胞癌的治疗有限,大多数患者总体预后较差。因此,仍需进一步探索更多针对HCC的防治策略。近年来,研究表明一些中药单体对癌细胞增殖、转移及癌组织血管生成具有显著的抑制作用,且具有无副作用及不良反应等优势。黄芪甲苷(Astra
学位
背景与目的 各种致病因子均可导致肝脏的急慢性炎症。长期的肝组织炎症状态致使肝纤维化的发生,而这将使肝癌的患病风险增加,对健康产生严重威胁。天然药物黄芪的有效成分为黄芪甲苷(AS-Ⅳ),有报道指出AS-Ⅳ具有抗炎、抗氧化等生物活性,并可通过调节Nrf2/HO-1和TGF-b1/Smad3途径抑制肝纤维化发展。Nrf2在受到氧化应激等刺激后,磷酸化后入核,刺激下游抗氧化基因的表达,产生肝保护作用;Sm
学位
近年来,随着基因测序技术的发展,全球积累了大量的组学数据。已有的相关研究表明,全球的生物数据总量以每15到18个月翻一倍的速度增长。生物信息学这门学科的出现就是为了充分利用这些数据信息,揭露出潜藏在复杂生命活动下的规律。模块分析方法一直是对全基因组学数据进行分析的基础性方法。基因模块被定义为具有相似功能和调控模式的基因集合,通过将全基因组划分为多个这样的基因模块,可以将一个大型复杂的生命系统拆解成
学位
随着移动互联网的快速发展,各类线上交易兴起的同时也催生了许多黑色产业。为了打击诸如垃圾注册、刷单、薅羊毛等黑产的行为,提高恶意欺诈及骗贷等作案成本,移动设备指纹技术应运而生。目前移动设备指纹研究多针对移动设备的运动传感器数据,依靠人工提取特征然后结合传统机器学习算法对设备进行分类识别。然而此类方法只适用于静止场景,在运动场景下对人类活动等噪声高度敏感而难以适用。此外,通过运动传感器数据可以推断出用
学位