对角矩阵求解的并行性技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:LCW8889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学计算伴随着计算机的发展在众多应用领域得到了广泛的应用,同时,多核处理器的普及有力地推进了并行计算在科学计算中的主导地位。对角矩阵求解是并行计算应用的一个重要方面,诸如计算机图形学、流体力学、泊松方程求解、三次样条曲线、萃取精馏塔以及大气模式等很多领域都涉及对角矩阵求解的科学计算问题。但现实中,科学计算应用的实际运行性能与期望性能的差距与日俱增,尤其大数据时代的到来让这一问题变得更加重要与紧迫,同时也促进了并行计算的进一步应用与发展。
  论文重点研究和优化了对角矩阵求解的并行性效率问题。
  首先,从算法的应用层面,以SPIKE2算法为主体框架,通过对SPIKE算法进行优化并结合Pivot算法提出一种并行求解对角矩阵的T-ISPA算法。该算法在保证提高求解效率的同时兼顾了计算结果的数值稳定性与内存数据布局转换机制的优化问题;针对严格对角占优矩阵,在T-ISPA并行求解算法的基础上提出了扩展算法SPIKE2-Thomas和SPIKE2-CR算法。
  其次,面对应用更为广泛的多对角矩阵的求解问题,为消除广义共轭余差算法在计算过程中的数据相关性,减少同步次数和降低并行进程间的通信开销,提出了具有自启动功能的IGCR算法。将该算法应用到几何多重网格光滑迭代过程中,对各向异性网格又进行了强耦合聚合处理,提出了具有强耦合几何多重网格的SCMC算法。通过设计的MPI多进程并行方案,提高了IGCR算法和SCMC算法中矩阵向量乘以及内积的并行进程处理能力。
  第三,为了进一步支持应用程序的执行效率,本文又从提高计算资源并行性的角度出发,在应用程序到计算资源的映射过程中,提出了HPMC进程调度算法。该算法依据低阶对角矩阵所对应的DAG图,以传统的表调度算法为理论基础,在异构多核处理器硬件运行环境下,通过进程聚簇技术提升了进程调度优先级的筛选机制,在进程映射到多核的过程中引入了进程复制方法,减少了进程间的通信时间。最后通过实验测试,表明HPMC进程调度算法相比于HEFT算法和CPOP算法能用更少的时间完成进程到多核的映射与执行,较好地支撑了需要高度并行的矩阵求解问题。
  最后,针对HPMC进程调度算法的性能受进程数大小的影响存在时滞现象,提出了一种基于改进烟花算法的高阶对角矩阵并行调度算法PSIFWA。PSIFWA算法首先通过设计烟花的位置编码,将连续空间映射到离散空间;然后通过改进高斯变异过程,设置自适应高斯变异维数以保证种群多样性,从而达到加快算法收敛速度的目的。最后为降低算法的时间复杂度,缩短找到最优进程调度序列所用时间,采用基于适应度值的锦标赛选择策略,避免了基于欧氏距离的轮盘赌选择策略时间开销过大的弊端。实验验证了在密集进程运行环境下,PSIFWA算法比HPMC算法、基本烟花算法、遗传算法及粒子群算法都有较好的时间性能,它能在较少的迭代次数内找到最优解,收敛速度更快,在进程数增大时仍能保持良好的寻优速度和求解精度。
其他文献
人类语音不仅提供了口语的语义信息,而且还包含了说话者的性别、年龄和情绪等相关特征。在过去十年中,语音识别由于许多原因已经变得必不可少。其中一个原因是它可以用于移动设备的身份识别和准入控制。另外,它还可以通过识别刑事案件中的嫌疑人来最大限度地减少嫌疑人的数量。此外,语音识别系统还可以用于推荐系统来基于人的年龄和性别推荐合适的商品。本论文所设计的年龄和性别识别系统,还可以进一步用于关于特定人群年龄和性
合成孔径雷达差分层析(Differential Synthetic Aperture Radar Tomography, D-TomoSAR)技术是近年发展起来的一项新的空间对地观测技术,它可进行高精度多维成像获得地表的高程以及形变信息。目前,该技术已在地质灾害预警、地球物理参数反演以及城市规划等领域得到了广泛的应用。与此同时,当前星载SAR系统正朝着多平台、多模式、高空间分辨和高重访率方向发展,
双目立体视觉技术作为一种主动测距方法,广泛应用在自动驾驶、虚拟现实、医学成像等领域中。由于制造误差、电路噪声等原因,双目相机实时采集的图像对存在着畸变、噪声污染等干扰,这些干扰会使得立体匹配效果变差。为了生成高质量、高实时性的图像对,本文在对相关理论进行研究分析后,优化、改进了图像畸变矫正算法和中值滤波算法,设计了基于FPGA(Fie1d Programmable Gate Array)的双目立体
学位
在现代工业生产中,随着生产效率的大幅度提升,传统的人工生产方式越来越不能满足现代化制造业的需求,现代化的生产方式需要一种全新的自动化技术,机器视觉技术应运而生。机器视觉应用图像识别技术代替人眼来做测量和判断,效率更高、精确度更好、客观性更强,且可以无休止的重复进行,大大提高了生产的自动化程度。本文对图像识别技术在机器视觉抓取系统中的应用进行研究,研究陶瓷基片识别和位姿获取算法实现抓取,具有一定的实
学位
随着移动互联网的迅速发展,移动网络流量呈现爆发式的突涨。移动用户对于各种内容文件的服务需求也日益增长。因此为了应对这些挑战,非常有必要向下一代移动网络架构引入新的技术应对流量骤增的现状。近些年,在移动网络边缘部署缓存被视为一种很有潜力的技术,通过在基站等边缘设备缓存流行内容,提高内容在网络内部的重复利用性,避免重复内容占用大量的网络资源。然而,移动边缘缓存的性能优化研究整体缺乏全面性与自适应性。同
学位
近年来,大型商场和仓库每年因盗窃而损失的金额达到千亿美元,而商品的盗窃检测系统都有着不完善的地方。传统的视频监控的方式很大程度上受到光线条件的影响,而现有基于射频识别(RadioFrequencyIdentification,简称为RFID)技术的盗窃检测系统不能有效处理一些非人为因素的误报警情况,如RFID系统的检测范围不明确导致可能识别到商场或仓库中未移动的物品,现有的基于RFID的盗窃检测系
学位
随着社交网络的迅速发展,越来越多的用户习惯于通过文本、图像、视频等多种媒体形式分享自己观点,参与其他用户的互动交流。挖掘并捕捉其中蕴含的主观性信息对于舆情分析、市场营销与投资预测等具有重大意义。因此,多模态情感分析已经成为人工智能领域的核心研究课题之一,引起学术界和工业界的共同关注。然而,研究界对交互特性的理解尚未明确与深入,建模交互的研究方法相对简单,以经典概率理论为基础的传统方法在交互建模方面
在近年来,机器视觉的发展紧随人工智能主流,机器人装配视觉依然成为必然趋势,机器视觉和机器人相结合的领域将具有广泛的应用前景,对机器人的灵活性和可操作性的提升具有决定性意义。今天的自动化机器视觉系统是名副其实的多功能化,机器人智能系统可以阅读代码,识别部件,操作机器和控制过程,它们还可以测试产品质量,并为优化生产操作提供有价值的数据,它们的多功能性是无限的。  机器视觉主要由机器视觉测量系统、机器视
学位
网络社区是人们共享知识、相互交流、沟通的平台。分析网络社区中人们留下的信息能够更好地理解帮助理解用户的偏好,辅助企业决策,从而创造更高的经济价值。情感分析是对包含情感因素的文本进行特征提取和选择的分类过程,人们可以从评论文本中分析用户对某个主题所表现出来的情感倾向。文本中包含的情感复杂多变,例如音乐社区中,人们对于音乐的评价所蕴含的情感,可能同时包含有多种情感的类别,如何准确的对文本的情感特征进行
学位
随着网络技术、计算机技术、智能芯片等技术的高速发展,以智能手机为代表的智能终端得到普及,作为物理世界和网络世界纽带的物联网应运而生。自诞生之日起,物联网受到世界各国政府以及专家学者的高度重视并取得瞩目的成果。物联网取得飞速发展的同时,其引发的安全问题日益突出:物联网用户身份安全认证问题,感知数据的数字完整性保护问题和感知层网络入侵问题等。  为了感知物理世界,物联网需要部署海量异构的感知节点以周期
学位