【摘 要】
:
大数据时代,随着技术手段不断进步,海量数据不断涌现。分子生物信息学领域的微阵列数据,网络购物的用户行为和交易数据,信息化金融市场的交易数据等等,这些庞大的高维数据给传统分析的低维数据数据分析方法提出了挑战,也推动了多重假设检验理论的应用和发展。随着生活水平的提高,人类寿命不断延长,癌症已经成为危害人类健康的头号敌人。而多数癌症患者早期大多性状不明显,且同一类癌症往往性状表现也不尽相同,如何从分子水
论文部分内容阅读
大数据时代,随着技术手段不断进步,海量数据不断涌现。分子生物信息学领域的微阵列数据,网络购物的用户行为和交易数据,信息化金融市场的交易数据等等,这些庞大的高维数据给传统分析的低维数据数据分析方法提出了挑战,也推动了多重假设检验理论的应用和发展。随着生活水平的提高,人类寿命不断延长,癌症已经成为危害人类健康的头号敌人。而多数癌症患者早期大多性状不明显,且同一类癌症往往性状表现也不尽相同,如何从分子水平了解癌症的致病机理,以便于早期的诊断和指定个体化治疗方案,医学界对此进行了很多研究,其中基因拷贝数异常随着基因工程技术手段不断发展而成为重要的研究方向之一。本文从乳腺癌基因拷贝数异常在分子水平上的致病机理这一问题入手,通过国内外有关于各类癌症患者组织样本中基因拷贝数异常的相关研究,以期在多元线性回归响应变量选择的情形下,研究受到基因拷贝数异常显著影响的乳腺癌基因表达类型。首先本文介绍了国内外关于癌症临床病例的研究,揭示了基因拷贝数异常与控制癌症产生、发展以及转移的基因表达水平存在显著性的相关关系,确立了研究课题具有实际意义。接着介绍多重假设检验领域控制错误概率测度的几种经典方法,主要为控制假阳性错误率FDR的方法,以及新近提出的响应变量选择的RBS方法,对比了q-value方法和RBS方法在乳腺癌数据集的分析中的效果。同时为了拓展RBS方法的适用情形,本文将适用于多元回归模型的主成分分析,基于距离相关性的筛选,基于projection correlation的筛选方法进行结合,结论总结有:1)RBS相较于q-value方法可以更有效地筛选受到基因拷贝数异常显著影响的基因表达类型。2)基于projection correlation进行多元回归模型预测变量降维的方法更适合与RBS方法进行结合;3)本次研究的方法可以为乳腺癌的早期诊断以及临床个性化治疗方案的制定提供丰富和可靠的研究支撑,具有一定的实际意义。同时在最后一章,也对于后续进一步的研究方向进行了总结。
其他文献
慕课是一种跨越时空、高效优质的教学资源。其字幕翻译在真正实现全球知识共享中的重要性不言而喻,然而该领域的翻译研究尚付阙如。本文基于耶夫·维索尔伦的顺应论,以上海某大学线上课程《数据时代的推断陷阱》字幕英译为个案,从语境关系的顺应、语言结构的顺应、顺应的动态性和顺应过程的意识程度等四个维度,分析本慕课字幕采取的翻译策略和技巧。研究认为,在翻译过程中注重语言的动态顺应能够提高慕课字幕的翻译质量,从而优
随着互联网时代的推进,网民能在网络上畅所欲言,但是随之而来的是各种毒性文本,毒性文本的存在将影响整个互联网环境,不仅影响网络社交环境,影响社会风气,更能影响未成年人的身心健康发展。如果能将网络上的毒性文本识别出来并加以标记,不仅可以净化网络环境,创造良好互联网氛围,还能加以利用做更多深入的语言学研究。国内的毒性文本监管仍存在些许不足,本文通过深度模型算法改进这些不足,摒弃关键词搜索方法,提高识别各
商业银行理财产品是由商业银行根据合同将从投资者处募集到的资金投入金融市场投资,并根据约定到期分配收益给投资者的一类理财产品。随着我国经济的发展和居民的投资观念逐渐增强,银行理财产品自2004年出现以来一直处于飞速发展中,但“刚性兑付”的存在带来了一系列问题,危害到金融市场发展。据此,2018年4月27日资管新规正式下发,明确要求严禁资金池嵌套、期限错配以及打破刚性兑付,揭开了我国商业银行理财产品的
近年来,为了顺应全面改革的要求,大型公立医院纷纷打破地域限制,通过布局多院区谋求更大的发展。“一院多区”的发展对财务管理提出了更高的要求,本文通过探讨和分析“一院多区”发展模式下存在的财务管理问题,提出适应多院区发展的财务管理方法和措施。
随着中国经济的发展,中国家庭的财富逐渐增加,为了实现对资产的增值保值,普通个人对投资的需求也不断加大。股票二级市场创造了许多财富神话,成为了不少人投资的重要选择,伴随着股票市场高收益的则是股票市场的高风险。普通个人凭借自己的知识和研究,虽然也有可能在股票市场中获得收益,不过这种可能性的确不高。目前中国的股票市场已经有大量专业的机构投资者,机构投资者往往吸引了最优秀的人才加入,组成有体系的研究团队,
作为经济市场运行的基础之一,市场信息效率逐渐进入我们的视野。由于当前市场普遍处于非理性的假设下,资产的价格并非是一成不变的,市场中的信息以及某些不可控的噪音都会对其造成影响影响。此时,信息这一变量便成为调节市场运行状态的重要因素,它可以直接对资产价格造成影响,同时能对市场噪声造成的影响进行控制。当资本市场具有较高的信息效率时,投资者可以充分地挖掘存在公司中特有的,未被公开的信息,从而将资源流向引导
在2019年12月20日,黄金期权正式在上期所上市,这是中国衍生品市场进一步发展的重要标志。期权以期货为基础,是一种新的金融衍生产品,具有独特的投资功能和风险管理价值。在2015年2月,中国期权市场推出了第一只期权——上证50ETF期权,相较于海外市场发展较晚。但随着期权制度建设的日益完善,期权市场的涉及范围与国内外影响力日益提高,国内对于期权的需求也日益扩大。自2017年3月起,国内陆续推出了豆
随着人工智能技术的逐步发展,以及围绕图像的深度学习体系的不断完善,深度学习在图像分类领域中愈发发挥着无法替代的角色,其应用范围更加广泛,过往的难题也更易解决。依托过去的技术,实现光伏行业中光伏电池片的缺陷自动分类极为困难,现借助深度学习中的卷积神经网络算法,该难题有望实现落地。光伏电池片的缺陷分类是对电致发光原理下的光伏电池片图片进行分类,卷积神经网络算法能够深度挖掘图像特征,分析以及学习。通过实
随着互联网技术的飞速发展,互联网金融对于传统金融市场的冲击也越来越猛烈,传统金融机构在产品营销方面面临的压力也是与日俱增,如何进行个性化营销成了亟需解决的问题。目前针对个性化推荐,金融机构使用的模型方法还较为简单,较传统营销方式效果提升不明显,故本文基于金融业务,提出了一套推荐方法,该方法能够很好地捕捉到用户的真实喜好,从而做到个性化推荐。它通过利用用户的历史购买记录,生成金融理财产品的向量表示与