【摘 要】
:
随摄像设备在智能手机端的普及与应用,数字图像已成为传播个人信息的重要媒介之一,数字图像具有方便快捷、内容易理解等特点,比起书面文字更容易让人们接受,因此被广泛运用在各个领域中。与此同时,为满足人们为数字图像添加自己想要表达的内容,各种功能强大的图像编辑软件应运而生,对图像的编辑使得图像原本的内容受到曲解,变成伪造图像。而这些伪造图像一旦在互联网以及社交媒体中传播,将会给人们带来错误的信息,对客观世
论文部分内容阅读
随摄像设备在智能手机端的普及与应用,数字图像已成为传播个人信息的重要媒介之一,数字图像具有方便快捷、内容易理解等特点,比起书面文字更容易让人们接受,因此被广泛运用在各个领域中。与此同时,为满足人们为数字图像添加自己想要表达的内容,各种功能强大的图像编辑软件应运而生,对图像的编辑使得图像原本的内容受到曲解,变成伪造图像。而这些伪造图像一旦在互联网以及社交媒体中传播,将会给人们带来错误的信息,对客观世界的认知判断、社会的公平稳定造成负面影响,也给现实生活中的真实性判断带来严重的冲击。因此,如何对伪造的数字图像进行识别是一个值得广大学者进行研究的问题。本文基于自制并收集的伪造图像数据集,共计1000张图像,其中真实图像500张,伪造图像500张,分别使用机器学习的方法进行图像真伪二分类的识别,使用神经网络的方法对图像的伪造区域进行定位,具体如下:首先是伪造图像的二分类识别,由于数据集中的图像存在过多与图像伪造无关的要素,因此需要对图像进行处理。本文提出一种基于块离散余弦变换(Block Discrete Cosine Transformation,BDCT)和局部二值变换(Local Binary Pattern,LBP)的方法,提取出图像的边缘特征,最后使用统计机器学习方法对提取的特征进行训练,实验结果为:第一,使用支持向量机进行训练,最优模型在测试集伪造图像的识别率为85.3%;第二,使用随机森林模型进行训练,在确定随机森林相关参数后,最优模型在测试集上得到的伪造图像识别率为89.9%;第三,使用XGBoost模型进行训练,并进行了十折交叉验证,最优模型在测试集上得到的伪造图像识别率为89.0%。经过三种模型的对比,可知随机森林模型的训练效果较好。其次是伪造图像的伪造区域定位,本文使用的是神经网络的方法,尽管神经网络模型是黑盒模型,缺乏一定的解释性,但神经网络模型可以通过大量实例的训练,学习到鉴别图像伪造区域的特征。因此本文基于神经网络的预训练模型,使用Faster R-CNN目标检测模型训练好的参数,再次训练得到本文所需要的图像伪造区域定位模型,并使用了不同来源的伪造图片验证模型的效果,结果表明,所训练的模型都能准确识别出伪造图像的伪造区域。
其他文献
随着当今世界医学成像技术的快速发展,核磁共振成像(MRI)和功能性核磁共振成像(FMRI)技术普遍用于医学疾病的诊断研究中,例如阿尔茨海默症。医学研究者们普遍认为阿尔茨海默症是一种由于大脑功能紊乱造成的疾病,从而研究阿尔兹海默症的脑区功能连接网络是医学研究者重点关注的问题。脑区功能连接网络的确定通常根据医生的经验和文献查询的方式来获得,这类方法缺乏以数据分析为基础去探讨脑区功能的连接网络,因此如何
基尼系数是衡量收入分配平等程度的指标,根据基尼系数的大小,可以准确地判断居民贫富差距。因此,精确估计基尼系数是尤为重要的。而基尼系数的计算依赖于收入数据,在实际生活中,由于收入涉及个人隐私,使得收入数据往往是存在缺失的。因此,从缺失数据的角度出发考虑基尼系数的估计问题更加具有现实意义。本文分别研究了完全数据和缺失数据情形下基尼系数的统计推断问题,以标准化的基尼平均差计算公式为基础,在完全数据集下,
股票是现代社会众多获取投资收益的投资方式之一。股票是股份公司获取资金的重要方式之一。股票预测一直是研究的重点与难点,人们为了在股票投资中获取收益,一直尝试不同的预测模型对股价及其走势进行预测,好的股价预测模型可以帮助股民获取更多的投资收益。时间序列模型由其时间复杂度低、短期预测有效而得到广泛应用。近几年机器学习得到了广泛研究与应用,许多机器学习算法被应用于金融问题的研究,如随机森林、神经网络和高斯
在医学领域、经济领域、工业领域和环境问题等的跟踪研究中,常常会收集到纵向数据和生存数据这两类复杂数据。在我们的建模过程中,纵向过程与生存过程通常是有关联的,因而联合建模这两类数据常被采用。它减少了对建模效果的估计偏差,并提高了对建模效果和其他因素的评估效率。常见的联合建模方法一般有两阶段法、共享随机效应项和共享轨迹函数。关于联合模型的参数估计方法,有频率学派方法和贝叶斯方法。与频率学派方法相比,贝
如今,社会老龄化现象越来越严重,阿兹海默症的发病率也逐渐增高,严重影响老年人的身体健康,给社会带来了新的问题和挑战。传统阿兹海默症的诊断研究是基于测量量表和核磁共振成像MRI、FMRI数据相结合的诊断技术。阿兹海默症的脑图像数据随着年龄的变化而变化,且目前没有较好的诊断技术来研究阿兹海默症进程的变化情况。因此如何对不同时段人脑图像数据建模分析探索阿兹海默症进程的变化是本文主要研究问题。本文采用动态
简单介绍了光刻胶的组成部分,综述了近年来国内外光刻胶成膜树脂合成、开发的研究进展,并根据不同曝光波长所需的不同光刻胶(包括紫外(UV)光刻胶、深紫外光刻胶、极紫外光刻胶等)进行了介绍。重点介绍了各光源下分子量和分子量分散指数对光致抗蚀剂的影响,并对国内外研究中通过不同聚合工艺制备的不同分子量光致抗蚀剂性能进行了评述,总结了近年来含有特定化学结构的光致抗蚀剂以及其制备工艺的研究进展。最后对国内外光刻
在跟踪研究中,通常会观测到同一个体的两个及以上的事件时间,在实际情况中,这些事件时间往往不是独立的。尤其在成对的器官中,当一个器官失效,另一个器官的生存时间也会发生变化,比如同一个人两个不同器官的衰竭时间、癌症复发时间和死亡的时间等,这些二元生存数据之间存在相依性。把相依生存数据看作独立的生存过程来研究,得到的结果会是有偏的甚至是错误的。因此,建立二元相依生存分析模型并对其进行统计诊断具有重要的理
缺失数据和失效时间数据通常同时存在于医学、生物学、社会科学、经济学等领域,特别是在一些生物医学相关的研究当中,数据往往是缺失的,例如在肺癌的研究中,由于某些病人跟踪一段时间后突然离世,从而造成数据的缺失。还有在对抗癌药物的研发过程中,需要将不同剂量的抗癌药物注射到小鼠体内,通过观测注射药物后小鼠体内肿瘤的体积大小来验证药物的药效,然而,在实验完成之前由于各种原因,小鼠可能会死去,或者由于一些其他原
随着我国经济社会的发展,人们生活水平逐渐提高,拥有更多的闲置资金,于是把目光转向一些理财产品上,股票因其有着较高收益的特性,成为了多数人的选择。但股票在有着高收益的同时也有着较高的风险性,股市纷繁复杂、变化莫测,诸多因素都对股价有着重要的影响。得益于行为金融学理论的支持,人们逐渐关注投资者的心理状况和情绪对于股市的影响。近年来,机器学习和自然语言处理技术飞速发展,使得通过网络媒体的文本信息来度量投
传染病对人类社会有很大的威胁,也是影响国家安全和经济发展的重要因素,如今我们所处的环境复杂多变,传染病的防治工作更为艰巨。如何对传染病数据进行分析和预测,这对国家的安全和经济发展来说是非常重要的,因此可以借鉴相关的数学模型对传染病数据进行研究。我国对新冠病毒肺炎的防治策略采取的是限制人口流动,提倡减少外出,戴口罩、不聚集等的“类SARS策略”,而国外部分国家采取的是不做太多干预的“类大流感策略”。