基于半监督协同训练的隔夹层识别研究

来源 :西南石油大学 | 被引量 : 0次 | 上传用户:galagala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,中国石油产量的70%都来自于老油田,其剩余可采储量相当可观。影响剩余油的因素有很多,但是地质专家普遍认为油藏内部发育的隔夹层是影响剩余油分布的主要因素之一。当储层内部发育有隔夹层时,隔夹层的分布会对油气水等流体的运动产生影响,因此使用测井资料对地下储层中隔夹层进行准确识别是挖潜剩余油气的首要工作。隔夹层识别问题在机器学习领域本质属于分类问题,如果样本分布满足有监督学习的假设,那么传统有监督分类学习算法就能解决隔夹层识别问题。但由于区域地质发育情况的不同,隔夹层在某一区域内的类别分布并不均衡,不满足传统机器学习样本均匀分布的假设。且由于油田取心费用昂贵,因此基于岩心标定的测井数据较少。综上,地质专家迫切需要一种能将无标签测井数据对象中或多或少的隐含信息与岩心标定的标签数据综合利用的隔夹层识别方法,以此来节约勘探成本和提升油田生产效率。本文对隔夹层问题进行了深入的研究和分析,针对取心标注测井数据较少,各类样本不均衡的实际状况,提出了基于半监督协同训练的集成自编码算法。首先参考异常检测思想提出了基于自训练方法和自编码神经网络的异常检测算法(Self-Training Based Auto-Encoder neural Network for abnormal detection in Interlayer identification,STAE)。STAE算法通过对自编码神经网络的重构误差进行分级实现了基于异常检测思想的多类样本识别,而后为了利用无标签数据中包含的全局信息,使用两类参数(得分中心点与得分区间)基于自训练方法进行模型自我更新,提高模型的自适应能力。最后结合Tri-training 框架,本文还提出了基于多视图协同训练和集成自编码神经网络的隔夹层识别算法(Interlayer identification algorithm Based on multi-view Tri-training and Integrated Auto-Encoder neural Network,MTAE),该算法首先使用原始测井数据特征和小波分解的时频特征组成双视图特征,然后基于Tri-traning框架训练集成自编码分类器,最后利用无标签数据的全局信息来提升模型性能。本文使用哈德逊油田某地区的二十口井作为数据集,进行了对比实验,对比了SVM(Support Vector Machine)、S3VM(Semi-Supervised Support Vector Machine)、GBDT(Gradient Boosting Decision Tree)三种算法。其中本文提出的算法与传统有监督学习方法SVM在各类隔夹层的识别准确率上都有较大的提升,由此侧面证明了在一定程度上,半监督学习方法比传统有监督学习方法更适用于此数据集。STAE算法较S3VM算法在数据集上取得了更好的效果,证明基于异常检测思想的模型更应用于测井数据这种深度域分布特性的数据集。本文提出的STAE和MTAE都相对GBDT算法在识别准确率上有一定的提升,说明在集成学习的基础上利用无标签数据优化决策边界的思路是可行的。除此之外,本文还设置实验分析不同置信度阈值条件下,半监督学习对模型性能的提升效果。
其他文献
医疗云存储服务是云计算中一个重要的服务,它在当今健康医疗数据大爆发时代为用户提供一种便捷、灵活和高效的数据管理方式。由于医疗数据的敏感性、数据的传输与存储都是在公开网络中运行、系统的复杂性和公共网络环境下攻击的频发性,使得外包存储的健康医疗数据和用户的身份隐私面临着严峻的安全威胁。特别地,用户通过无线医疗传感器设备收集重要的生理特征参数,通过无线体域网实时地将这些健康医疗数据上传到医疗云服务器进行
学位
车载自组织网络,简称车联网(Vehicular Ad-hoc Networks,VANETs),其在智能交通系统中已经变得越来越重要,它在提高交通安全性和交通效率方面发挥着重要作用。在智能车辆的系统中,智能车辆能够高效地交换重要或紧急的交通信息,能及时帮助驾乘人员做出驾驶决策,因而受到了汽车界和国内外学术界的广泛关注。由于VANETs是一个规模巨大的、开放式的无线局域网络,攻击者可以随意窃听在信道
学位
随着网络科学理论的发展,网络已经成为了一种有效描述数据之间关联性的语言,网络建模分析也广泛运用于各种数据分析场景,成为一种高效的建模分析手段。其中,网络建模分析任务中使用机器学习方法是一种流行且高效的手段,有效的网络表示是实现机器学习方法的关键。目前,基于静态网络的表示学习方法已经基本成熟,但是更多的实际数据是随时间变化的,这样具有动态演化性的数据用网络语言描述就是节点、边都随着时间不断变化的动态
学位
<正>学习任务群视域下的大单元教学,是在素养型目标引领下,对接课标和单元语文要素,确定单元目标,依据教学目标和教材单元教学内容,创设真实的任务情境和挑战性的学习任务,设计能激发学生持久兴趣和深入探究的任务,在学习情境和任务驱动中展开的教学。同时,要特别关注改进教学评价,引导学生在学习过程中形成关键能力和必备品格。笔者选取四年级上册第五单元,找寻本单元任务群的落脚点,进行大单元教学设计,以期实现学生
期刊
阐述屋顶分布式光伏项目的规划设计,多方面进行分析,如项目收益、设计规划原则、系统架构设计,从而有利于计算出光伏项目实际投资价值。
期刊
多元时序数据广泛存在于各行各业,人们通过部署传感器来获得反映系统特征的数据,并通过数据挖掘得到有用的结果。多元时序数据具有结构简单,可解释性强的优点,能直观地揭示数据间的时序关系。然而数据往往是海量且动态更新的,因此如何从中快速挖掘最新的序列模式是值得研究的重要问题。本文首先定义了多元时序数据上的状态转移模式(State Transition Pattern with Perioidc Wildc
学位
随着互联网逐步深入到人们的生活,各行各业涌现出大量数据。大数据为从中提取有价值的信息带来了空前未有的机遇和挑战。推荐系统是解决信息过载的有效工具。它通过用户的历史数据来挖掘用户的兴趣偏好,从而发现用户可能感兴趣的信息并进行推荐。但对于庞大的数据以及稀少的交互信息,推荐系统首要面临的就是数据稀疏性问题。数据稀疏性是目前协同过滤面临的主要挑战之一。考虑到现实中用户在选择商品时,更倾向于用户朋友推荐的商
学位
测井作业是石油勘探开发工程作业的重要一环,它包括放射性测井、电法测井和声波测井等。这是一项高风险的系统工程,面临很多影响测井作业安全的因素,这些安全因素可能会导致不可预料的安全问题,威胁到测井作业人员的生命安全,造成企业财产损失。因此,开展测井作业的安全管理与评价研究与开发具有非常重要的意义。本文以西南某测井公司“测井作业安全管理与评价系统”项目为背景,针对测井作业安全评价的实际情况、特点和评价目
学位
超声散斑运动追踪技术是许多医学超声成像技术(如超声弹性成像,血流成像等)中的关键步骤,一直以来都是研究人员关注的重点。在超声射频信号中,超声散斑的运动实质上表示了组织中各体元的运动情况,因此可以使用散斑追踪技术估计组织内各位置的运动位移情况。由于超声设备自身采集信号所引入的电子噪声、人体组织自身运动及组织受到探头挤压引起的大变形等去相关因素对超声散斑运动追踪技术的准确度和算法的鲁棒性提出了更高的需
学位
基于深度学习的卷积神经网络在目标图像检测与识别、图像语义分割领域有着突破性进展。本文分别就医学图像的目标区域检测、分割进行详细地探讨,并深入地挖掘病理图像内部存在的相关性。颅脑MR图像中对目标区域三叉神经的检测是对颅脑内三叉神经区域疾病诊断的重要依据之一。目前,常见的医学图像检测算法为对医学图像中某一组织的边缘、轮廓进行检测或增强,鲜有对颅脑MR图像中三叉神经区域的自动检测的研究。传统的阅片识别三
学位