【摘 要】
:
随着信息技术和互联网的发展,数据库管理系统作为基础平台软件,在信息系统中扮演日益关键的角色。目前,国内多个核心行业仍大量使用国外的数据库产品,存在重大的安全隐患。因此,在国际形势日趋复杂的今天,发展国产数据库,让更多应用运行在国产数据库产品之上已是当务之急。数据迁移是数据库国产化的重要举措,然而现有的数据迁移项目大多采用直接迁移的方法,未全面了解源数据库并根据迁移数据库间的差异完成迁移,这导致数据
【基金项目】
:
与浪潮集团合作的工信部国家重大创新工程项目;
论文部分内容阅读
随着信息技术和互联网的发展,数据库管理系统作为基础平台软件,在信息系统中扮演日益关键的角色。目前,国内多个核心行业仍大量使用国外的数据库产品,存在重大的安全隐患。因此,在国际形势日趋复杂的今天,发展国产数据库,让更多应用运行在国产数据库产品之上已是当务之急。数据迁移是数据库国产化的重要举措,然而现有的数据迁移项目大多采用直接迁移的方法,未全面了解源数据库并根据迁移数据库间的差异完成迁移,这导致数据迁移项目出现数据质量差、迁移效率低下、资源配置不当等问题,甚至导致迁移项目的失败。针对数据库迁移项目中,缺少对原有数据的认识、对迁移数据库间差异的了解的问题,本文设计并实现了一套基于全息画像的数据库迁移评估系统,它从多个角度对数据库进行解析,全面刻画数据库,为迁移工作提供支撑。本文的主要工作和贡献总结如下:(1)在传统数据库迁移评估过程中,通常采用专家决策方法,由专家主观评价数据库并给出数据库画像,这会引起评估成本高、过程慢等诸多问题。针对此问题,本文基于机器学习方法,设计了画像概况模型,从规模、复杂度、负载、风险、会话五个维度直观刻画数据库。为了模型的构建与训练,本文根据历史迁移项目数据制作了数据库实例数据集,提出了画像概况模型生成算法,使用多种机器学习方法对画像概况建模,探究对比不同模型间与相同类型不同参数模型的效果,得到各维度最优模型,共同组成最终的画像概况模型。设计了模型评价方法与对应的实验,通过实验验证了画像概况模型的有效性。(2)为了全面刻画源数据库,分析源数据库与迁移目标数据库间差异,本文基于画像概况模型,设计并实现了数据库迁移评估系统,结合机器学习与数据可视化技术实现对迁移工作的决策支持。系统包括三大模块:数据采集模块从对象、SQL、性能等方面深入挖掘数据库,通过数据采集工具自动采集源数据库信息;源库全息画像模块根据采集结果,全面分析数据库对象特性、复杂度、性能、容量等多方面数据,并对数据进行可视化处理,展示画像概况模型与数据库全貌信息;兼容评估模块根据源数据库与迁移目标数据库间差异,对所有对象、SQL语句进行兼容性评估,并给出改造建议,为迁移工作提供决策支持。(3)根据系统工作流程,对数据库迁移评估系统进行了完整的系统功能测试,通过测试每个模块的每个功能并展示测试结果,证明了系统的可行性与可靠性。
其他文献
伴随着电子信息技术的高速发展,无人作战飞机(UCAVs)凭借其出色的作战能力和低维护成本,成为了世界各国在信息战上的焦点。无人机自出现后已经改变了现代战争形式,也已经发展出多种多样的军事用途,而具有低成本特性、能够协同作战的无人机集群将在未来战争中发挥优势,是未来战争中的关键。而未来战场中信息量爆炸,无人机能否获得有效的战场态势信息,形成有利的决策是无人机对抗研究中的基础和重点。应用强化学习方法的
数字图像是以二维数字像素组形式表示的图像类型,因其具有信息质量高、传输能力强、处理相对简单等特点而在众多领域得到了广泛应用,已成为日常生活中不可或缺的信息表达方式之一。近年来随着各种图像编辑软件的不断涌现,人们对图像的修改与编辑越来越容易,甚至能够轻松实现对图像内容的篡改与伪造,图像盗用、侵权等问题与日俱增,这对图像版权的保护无疑是一种巨大冲击。如何高效检测篡改图像并防止二次确权已成为图像内容版权
无人机被广泛应用在民用和军用领域的同时也对公共安全和航路安全等构成威胁,因此对无人机目标智能感知技术的研究具有重要的现实应用迫切需求。热红外成像设备由于具备全天时的监视能力因此被广泛用于监测无人机,然而在远距离红外成像条件下,无人机目标特征微弱且很容易受到复杂背景的干扰,这对无人机的鲁棒检测带来了严峻的挑战。传统的目标检测方法对无人机目标的特征表征能力和知识利用有限,对复杂真实场景感知能力差。因此
随着数字技术的发展,数字视频的应用和需求日益增大;然而视频采集常常受成像系统以及环境等因素的影响,导致视频分辨率较低而无法满足需要。基于软件方法的视频超分辨率重建技术能够将低分辨率视频帧融合成较高分辨率的图像,成为近年来计算机视觉方向的研究热点。目前基于深度学习的视频超分辨重建算法大多依赖帧间对齐而忽略了帧间时序相关性。本文从注意力机制的角度出发、融合时空信息,提出基于时空注意力机制的视频超分辨率
随着基于位置服务(Location-Based Service,LBS)的应用日益广泛,位置数据的规模也急剧膨胀,本地服务器负荷接近极限,将数据外包给具备海量存储空间和强大计算能力的云计算平台成为必然趋势。位置数据与个人隐私高度相关,用户通常将数据加密后上传至云端,从而预防云端获取任何有效信息,但是数据加密后不利于用户进行检索。因此,一个能够同时保障数据机密性和可用性的云端安全检索方案,可作为位置
近年来,由于互联网数据的爆炸式增长和多样化特点,跨模态检索成为了一个研究热点。跨模态检索就是利用一种模态类型的数据检索另一种模态类型的数据,可以帮助人们快速有效的利用不同媒体数据。哈希学习方法具有存储成本低、查询速度快的优点,利用哈希学习方法进行跨模态检索可以在一定程度上提高检索性能。然而,目前利用哈希学习进行跨模态检索的方法存在两个问题:一是现有的跨模态哈希方法只学习了数据的全局特征,全局特征表
2019年,一种需要指定聚类数和均值数的K-多均值聚类算法被提出。此算法是K-means算法的扩展,一方面运用了多均值聚类的思想,为每个类设置多个均值,从而解决K-均值算法无法处理非凸数据集的问题,另一方面借鉴K-means算法的理论,把多均值数据集的聚类任务转化成一个优化问题后,迭代更新每个样本点的所属均值和所属类,从而解决多均值聚类算法的均值融合问题。K-多均值算法相比同类算法而言,聚类效果更
在国家政策的鼓励支持下,集成电路(IC)行业进入快速发展阶段。正是由于IC的快速发展,使得模拟芯片也在近几年有了更加广阔的应用领域。其中逐次逼近型模数转换器(SAR ADC)作为一种常用的模数混合芯片,它具有低功耗,易制造,利于集成等优点,且在实际设计中,可以很好的适应工艺转变的需求,这些优点使它在工业控制,生物医疗,传感器网络等需要中等工作速度以及转换精度的领域受到了极大的青睐。随着这些领域对使
随着科学技术的发展,特别是人工智能技术的兴起,任务型多轮对话系统逐渐成为学术界和工业界的研究热点。任务型多轮对话系统针对具体任务场景进行设计,通过与用户之间进行对话交互,收集所需信息,帮助用户完成特定任务。目前,任务型多轮对话系统主要有基于管道和基于端到端两种构建方式。基于端到端的方法由于存在对数据需求量较大、可解释性差和对话流程难以控制等问题。因此目前主流的做法是通过管道的方式构建任务型多轮对话
为了尽可能的减少执法安全事故,提升公安机关的执法形象与执法公信力,以及执法办案效率,大力的推进公安大数据智能化建设成为了行业发展的迫切需要。依托于此需求,近年来,执法办案中心的人员定位管理系统逐步发展,智能手环的应用也趋于成熟,但始终摆脱不了嫌疑人员的行为无法记录,执法办案流程以及执法行为无法监管等行业痛点,且智能手环自身也存在成本过高、续航不理想、个人信息易泄露等缺点,如何在减少甚至不使用智能手