高性能计算机系统管理和优化的研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:qgf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高性能计算机的飞速发展使得系统管理工作变得尤为重要。要利用高性能计算机强大的计算能力,就必须通过有效的系统管理使其能够稳定的提供服务。作为院三层超算环境的建设单位和总中心,中科院超级计算中心的宗旨是面向科学院乃至社会提供尽可能强的高性能计算能力和技术支持。本文从中科院超算中心的实际需求出发,以向用户提供更好的计算资源和支撑服务为源动力,针对高性能计算机系统信息的获取和分析、系统性能优化、系统资源管理、用户作业管理等几方面问题分别进行了研究和讨论。论文的主要成果包括以下几个方面:   1.阐述高性能计算机系统管理的任务和内容,并提出评价高性能计算机系统管理工作的若干因素。   2.针对胖树结构Infiniband集群的网络通信冲突,提出根据实时子网信息开展优化工作以避免和缓解冲突的思路,并提出用于检测和处理通信冲突对的端口索引法,该方法的性能可以满足实际需求。   3.针对Infiniband集群中MPI并行程序通信性能优化问题,提出了通过优化进程映射方案来保障MPI通信性能的方法框架。以通信损失值cl作为评价指标,设计了进程映射优化方案的模拟退火搜索算法,实测表明针对给定通信模式优化的进程映射方案使相应的MPI通信性得到一定提升。   4.针对高性能计算集群作业队列划分及资源动态管理工作,以通信冲突系数cc作为评价指标,设计了队列划分优化方案的模拟退火搜索算法,优化方案能够使队列中的作业获得更好的通信性能;用参数估计的方法求取队列的负载度,并以此为参数设计了队列中节点资源的动态调整机制,用以平衡队列负载和降低系统功耗;   5.针对高性能计算机的用户作业调度机制问题,提出了基于用户及其作业情况评价的优先级调整机制,在该机制作用之下,得到更高评价的用户更容易获得更多的系统资源。   总而言之,高性能计算机的系统管理是包括多项复杂而又严密的工作的整体性工程,本文的工作也只是局限在某几个方面针对特定运行状况所产生的特定需求开展的相关研究和实践,并期望能够对其它类似工作提供一定的参考价值和指导意义。涉及系统管理的更多更具体的工作还需要通过更加深入细致的长期学习和实践来完成,并从中总结出理论和经验,这才是高性能计算机系统管理水平不断提高的动力源泉。
其他文献
随着我国生产力的发展和制造业的转型升级,以及机器视觉技术的广泛应用,越来越多的企业引入机器视觉技术来降本增效,大量的造纸、印刷、玻璃等企业也引入了在线表面检测系统作为
人脸检测是指在输入图像中提取人脸(如果存在)的位置、大小、尺度和姿态等信息的过程。人脸检测技术是计算机视觉与模式识别领域的一个前沿课题,在身份识别、感兴趣区编码、
近年来,视频监控技术在各个领域得到了广泛的应用。目标检测与跟踪是视频监控技术的关键,如何有效的进行多目标检测与跟踪是目前视频监控研究领域的热点和难点。论文针对遮挡
随着多媒体技术和网络技术的不断发展,电信网、计算机网和有线电视数字网三大网络相互渗透、业务层上相互交叉,逐步走上了“融合”的道路。同时,随着网民数量的急剧增长,现有
狭缝联动摄影系统是一套用来测量弹丸飞行姿态,章动角,章动周期等参数的系统。传统的狭缝联动摄影系统由于线路比较多,仪器比较大,加上靶场常有野生动物啃食线缆,对于测试系统来说
随着网络通信技术和微电子工业的发展,工业现场控制系统已经从模拟控制发展到全数字控制,而且其性能也在不断地提高,在数控机床、工业机器人以及机电一体化加工与测试等设备
学位
自然语言理解又被称为自然语言处理或计算语言学,它是人工智能领域中的前沿难题之一。自然语言的识别和处理是人工智能研究的最重要的课题之一,也是人工智能研究的关键。其中
软件体系结构正从单纯的系统高层设计蓝图,转变为对软件系统开发运行、演化维护等各阶段的指导性要素。如何提供一个合适的工具(特别是可视化工具)以对此过程提供支持,是在以体
粮食是关系国计民生的重要战略物资,粮食安全与社会的和谐、政治的稳定、经济的持续发展息息相关。施肥作为粮食增产的主要手段,在保障国家粮食安全中占有非常重要的意义;但是
学位
在Web服务架构中,UDDI注册中心为Web服务发布与发现的中介,亦肩负部分Web服务管理的功能。但是由于缺乏商业利益驱动,传统、开放的UDDI注册中心并未发挥其应有的作用。微软和