论文部分内容阅读
计算机硬件性能在摩尔定律的推动下越来越强大,这促使高性能计算机(HPC)也在发生着改变,那些位于数据中心的体积庞大的高性能计算机运算速率已经跨过了每秒千万亿次的门槛,而另一些计算能力在千亿次甚至万亿次、但体积小巧的高性能计算机则走上了桌面,其应用领域也日渐扩展。
高性能计算(HPC)离不开超级计算机。在一些大学和研究机构的实验室里,我们常能见到外形巨大的大型机器,它们几乎占满了机房。尽管在未来这些超级系统绝不会消失,但我们同时也看到,往日一直由超级计算机来处理的一些应用正在走向桌面。
究其原因,分析人士认为,在一台标准PC上,8年前大约需要花1小时才能处理的任务,现在只要6秒钟就能完成,因为桌面计算机的处理能力、图形处理器(GPU)的性能、网络带宽和固态硬盘速度等都已经有了大幅提升,加上64位的吞吐量,这些改进已使桌面计算机越来越适合处理大规模计算项目。
正是由于这些进步,向“桌面端超级计算机”转变的步伐已经迈出。眼下,地震模拟、核武器储备模拟和DNA研究仍然还在传统的超级计算机上进行,但随着处理器在今后10年间向多核技术发展,可想而知,以上这些应用(或部分应用)都会进入到桌面端。
麻醉剂药效的追踪
尽管现今医生们知道如何开麻醉剂,也知道其药效,但并不知道病人被麻醉入睡后,这些药的分子在起什么作用。这种分析需要强大的计算能力,要既能查看麻醉剂何时进入呼吸系统,还能查看如何开始发挥药效。
为了解决这一问题,美国天普大学(Temple University)的研究人员研制出了相关的模型,可测试出对神经细胞中的分子实施麻醉后出现的后果。目前,该模型正在超级计算机上运行,不过,他们计划将在有4个节点的NVIDIA(英伟达)GPU集群上进行运算。这不但可以省钱,还能让研究人员有更大的灵活性,他们可以在做好准备工作的时候进行测试,而没必要非要在事先安排好的时间段里才能使用超级计算机进行测试。在这种应用需求下,每个GPU都拥有一个小型HPC集群的计算能力。GPU运算所涉及的数学运算其规模相当于通常用来为渲染视频游戏像素的运算。
项目研究人员Axel Kohlmeyer博士表示,想弄明白这种模拟,最好的办法就是想像一只盒子里面塞满了橡皮球,每个球的尺寸略有不同,运动速度也略有不同。它们之间相互用弹簧连起来,而这些弹簧的强度也不一样,使得有些球的运动速度比较快,而有些较慢,反应不一样。Axel Kohlmeyer可以在模拟中跟踪所有分子的活动,看看麻醉药在人体中的效果。
Axel Kohlmeyer说:“分子会形成粒子团,它们的运动方向由相互联系的数量来决定。”他解释说,模拟已经发展到了相互之间的联系均衡的阶段。温度的变化会引起振动,使分子出现新的活动。“计算模型难就难在需要成千上万错综复杂的相互联系。我们不仅想知道某些点之间的相互联系,而且还想知道以后会如何慢慢变化。”他补充说,另一个难题就是不得不经常重复运算。
对Axel Kohlmeyer来说,模拟的目的在于发现人体中到底何时出现什么感觉都没有的情况,而弄清楚了这点,就有望研制出新型的麻醉药,或帮助医生查明为什么手术后会出现记忆力减退之类的问题。
手术模拟
美国俄亥俄州哥伦布市俄亥俄超级计算中心(OSC)的研究人员发现,不是每项模拟都需要传统的超级计算机。OSC主任兼生物医学应用部门的接口实验室研究科学家Don Stredney发现了超级计算机通常存在的一个局限性:批处理进程是静态的,只能在预定的时间段运行。它们无法提供实时的相互联系,所以无法模拟真实的外科手术。他表示,成本在6000美元到10000美元的桌面工作站使他的团队可进行手术模拟,实时显示外科手术是如何改变病人身体结构的。
Don Stredney表示,他所在的行业得益于计算机游戏领域的创新,因为普通的消费级GPU的功能已经变得极其强大,只要极低的成本就能得到非常逼真的效果。该领域的研究人员使用普通PC运行标准的GPU,比如来自AMD公司ATI部门和NVIDIA公司的GPU,但不是高端GPU集群。不过他们发现,当一些模拟中的数据集变得太大时,就需要重新使用超级计算机运算。Don Stredney表示,当出现数据集急剧变得非常庞大,或每一幅图像都有数GB大小,以及数据采集时通常为0.5TB大小的多尺度数据集这些情况时,他的团队会重新使用超级计算机。他表示,实时视觉和听觉模拟需要越来越大的数据集和复杂的相互联系,因而需要更高端的系统。
汽车设计
Autodesk公司汽车部门的Ed Martin经理表示,注塑模拟对汽车厂商来说很重要。注塑是指利用塑料材料制作零部件的一种工艺。模拟可显示注塑模(比如保险杠)会不会引起痕陷,注塑模与汽车其他零部件的配合度如何,模拟还能暴露出任何瑕疵。设计师要考虑许多变量,如注塑模温度、几何形状以及注塑工艺与某些材料的适合程度等。Ed Martin解释说,单单防护板的一个物理原型造价就超过100万美元,所以模拟越准确,需要制造的原型数量就越少,因而生产成本就越低。
Ed Martin说:“模拟过去需要安装大量的集群计算系统,但我们现在用当前的桌面计算机就能获得同样强的能力。”他表示,在这方面起到最大作用的桌面领域的一些进步包括:采用多核处理器、使用多个GPU以及64位吞吐量。Ed Martin使用的就是可以从沃尔玛买到的标准桌面计算机,它们配备了兼容3D的最新GPU和英特尔双核处理器。
汽车行业还使用桌面软件来为汽车设计制作模型。借助这类工具,汽车厂商就能制作出复杂的透视图,效果可与一流视频游戏中的图形相媲美,甚至更出色。值得关注的是,当这些模型在桌面PC上制作完毕后,常常可以用于营销资料和电视广告中。Ed Martin表示,完全可以将超级计算机上制作的模型传输到PC上,但如今PC之间传输文件来得更简单,因为文件格式在各应用程序之间是兼容的,如果通过标准网络来进行传输,则有可能将图形传送给数量更多的用户。
举一个在桌面上制作模型的例子。设计师常常建立车漆模型,认真观察金属片以及它们在某些塑料上的外观,或者观察车漆在某些光照条件下会不会显得没有光泽。模型越准确,它们的制作工艺就越集中。过去,因为车漆中使用的高分子材料大约有8000种,因此,高性能计算环境必不可少,Ed Martin表示,如今桌面系统就能胜任这种高速处理任务。
基于Web的计算搜索
HPC走向桌面最值得关注的途径之一就是经由Web。眼下这方面的最佳例子就是WolframAlpha网站,按该网站自己的话来说,就是互联网上的这个“计算知识引擎”旨在“收集和保存所有客观数据,能够计算可以计算的任何对象。”
这方面的巨大变化在于,虽然在WolframAlpha.com上进行的搜索还是在超级计算机上进行的,但搜索结果几乎可以马上返回到浏览器中。比如说,键入“moon”这个简单的字后,其系统就会开始一系列复杂的计算,计算月球相对地球的轨道以及一段历史时期内的平均距离。
沃尔夫勒姆研究公司(Wolfram Research Inc)的架构师Schoeller Porter表示,之所以能近乎实时地进行运算,那是由于HPC部件的成本降低了。在过去,这种复杂运算需要向超级计算机请求运行批处理任务,请求占用几分钟、几小时甚至一天的处理时间。这倒未必是由于运算本身需要很长时间,而是由于处理资源极其昂贵。
你不妨亲自试一下,往WolframAlpha搜索引擎中输入一些运算请求,比如询问6个月后檀香山的潮汐(tides in honolulu in 6 months),还可以输入类似以下一些运算请求:International space station jun 24(国际空间站,6月24日);skychart Timbuktu yesterday at 8:00pm(Timbuktu昨晚8点的星空图);y’’ sin y = x(数学表达式);GATTAACCC(基因组序列)等。
在WolframAlpha上进行搜索时,可以在桌面上随意改变任何一个变量。你会注意到,一些查询所花的时间比另一些查询来得长,这取决于超级计算机需要多久才能确定结果。
虽然谷歌搜索也依赖后端的超级计算机或集群,但它们所用的计算算法与WolframAlpha不一样。谷歌搜索信息后提供相关链接,WolframAlpha提供给用户的是实际信息,而不是链接,这些信息可能是从知识库获取的,也可能是由它执行的运算生成的。
天气预报
英特尔公司高性能计算软件解决方案部门主管Bill Magro表示,天气预报在过去的20年经历了重大变化,从原来的仅仅提供天气模式的概况变成翔实资料的显示,比如每个风暴中心的详细资料。之所以发生这种变化,主要是由于天气预报所需的庞大数据集现在可以放在桌面计算机的存储器中,其处理能力也有了突飞猛进。现在用于气象的部分天气模拟可以在地方电视台的桌面计算机上进行,而不是只能在监测天气的政府机构里才能进行。
天气预报的建模极其复杂,因为天气在开放的3D空间不断变化,在温度、位置、风力及其他因素方面有成千上万个变量。天气模型取一个空间范围,比如5000米的网格,一个数据点代表每个方向的每5000米,然后把它缩小到1000米,之后再缩小到500米。Bill Magro解释说:“因为从三个维度来缩小,计算要求则提高了8倍。不仅仅数据更多了,所建立的模型也更详细了。这其实说到底就是需要拥有足够的内存和足够的计算能力。”
桌面计算机已经开始用于一些地方电视台的天气模拟。未来,随着处理器技术的进一步发展,我们可以在PC上运行所有详细的个人天气预报。Bill Magro表示,到那时,个人可以使用桌面计算机来查看邻近地区的天气模式,或者根据遇到的天气状况和输入到模型中的天气状况,预测6个月后你想去的度假地的天气情况。
更多应用紧随而来
美国佐治亚理工学院(Georgia Institute of Technology)的高性能计算执行董事David Bader展望未来认为,在接下来的10年里,HPC的另外几种应用会出现在桌面端。
David Bader表示,现在有望发现社会网络当中出现的新趋势,或确认影响社会网络的关键因素。可以给出相应的建议措施,以改善诸多社会行为的能源效率,比如确定合理交通路线,以免堵塞;安排好计算机应用的运行时间,以便尽量减少能耗;监测智能电网等。其他发展前景,包括利用大量的公共照片来构建3D场景,利用发言人的身份证件实时记录电视电话会议的文字内容。
虽然专家们一致认为,特大型超级计算机将在今后存在一段时间,但另外哪些传统的HPC应用最终会出现在桌面端,很值得期待。
链接
桌面端的特效
虽然电影行业仍然依赖传统的高性能计算机来制作特效,但好莱坞在很早之前就采用64位工作站把制作特效的一部分工作转移到了桌面上。
电影《2012》和《阿凡达》等影片中的特效通常需要异常强大的处理能力,明眼人一看就知道,由计算机生成(以及消费级软件制作)的动画瀑布与真实的瀑布有着明显区别。工业光魔(Industrial Light and Magic)、Uncharted Territory工作室和梦工厂等电影公司依赖庞大的计算集群和多台服务器来制作特效,单单制作一帧视频就要花好几个小时。
计算机成像(CGI)特效需要强大的计算能力。运用技术让光均匀地照射到物体上,然后一起移动,仅仅在一个镜头中,屏幕上同时就有数百万个像素。Autodesk公司电影和电视行业经理Bruno Sargeant表示,着色器模型也起到了帮助作用,它相当于像素的催化剂,使用数学算法让像素的移动显得更逼真。
但高端工作站已经开始发挥作用。Adobe和Autodesk这两家公司都一马当先,让桌面计算机也能处理好CGI特效,而不需要庞大的多台服务器或集群。前者拥有64位Mercury渲染引擎,而后者一款名为Smoke的专业软件将在今年11月中旬向Mac Pro计算机推出。Bruno Sargeant表示,速度快得多的总线、多核处理器、固态硬盘和GPU加速,这些已经万事俱备。
瑞典业务开发咨询公司Artair Group的分析师Bjorn Andersson说:“电影特效领域的竞争极其激烈。一些电影的成功依赖它们首次使用了哪种开拓性、突破性的特效。这反过来依赖两个因素:一是能使用多强大的原始计算能力?二是开发新的软件功能。”
高性能计算(HPC)离不开超级计算机。在一些大学和研究机构的实验室里,我们常能见到外形巨大的大型机器,它们几乎占满了机房。尽管在未来这些超级系统绝不会消失,但我们同时也看到,往日一直由超级计算机来处理的一些应用正在走向桌面。
究其原因,分析人士认为,在一台标准PC上,8年前大约需要花1小时才能处理的任务,现在只要6秒钟就能完成,因为桌面计算机的处理能力、图形处理器(GPU)的性能、网络带宽和固态硬盘速度等都已经有了大幅提升,加上64位的吞吐量,这些改进已使桌面计算机越来越适合处理大规模计算项目。
正是由于这些进步,向“桌面端超级计算机”转变的步伐已经迈出。眼下,地震模拟、核武器储备模拟和DNA研究仍然还在传统的超级计算机上进行,但随着处理器在今后10年间向多核技术发展,可想而知,以上这些应用(或部分应用)都会进入到桌面端。
麻醉剂药效的追踪
尽管现今医生们知道如何开麻醉剂,也知道其药效,但并不知道病人被麻醉入睡后,这些药的分子在起什么作用。这种分析需要强大的计算能力,要既能查看麻醉剂何时进入呼吸系统,还能查看如何开始发挥药效。
为了解决这一问题,美国天普大学(Temple University)的研究人员研制出了相关的模型,可测试出对神经细胞中的分子实施麻醉后出现的后果。目前,该模型正在超级计算机上运行,不过,他们计划将在有4个节点的NVIDIA(英伟达)GPU集群上进行运算。这不但可以省钱,还能让研究人员有更大的灵活性,他们可以在做好准备工作的时候进行测试,而没必要非要在事先安排好的时间段里才能使用超级计算机进行测试。在这种应用需求下,每个GPU都拥有一个小型HPC集群的计算能力。GPU运算所涉及的数学运算其规模相当于通常用来为渲染视频游戏像素的运算。
项目研究人员Axel Kohlmeyer博士表示,想弄明白这种模拟,最好的办法就是想像一只盒子里面塞满了橡皮球,每个球的尺寸略有不同,运动速度也略有不同。它们之间相互用弹簧连起来,而这些弹簧的强度也不一样,使得有些球的运动速度比较快,而有些较慢,反应不一样。Axel Kohlmeyer可以在模拟中跟踪所有分子的活动,看看麻醉药在人体中的效果。
Axel Kohlmeyer说:“分子会形成粒子团,它们的运动方向由相互联系的数量来决定。”他解释说,模拟已经发展到了相互之间的联系均衡的阶段。温度的变化会引起振动,使分子出现新的活动。“计算模型难就难在需要成千上万错综复杂的相互联系。我们不仅想知道某些点之间的相互联系,而且还想知道以后会如何慢慢变化。”他补充说,另一个难题就是不得不经常重复运算。
对Axel Kohlmeyer来说,模拟的目的在于发现人体中到底何时出现什么感觉都没有的情况,而弄清楚了这点,就有望研制出新型的麻醉药,或帮助医生查明为什么手术后会出现记忆力减退之类的问题。
手术模拟
美国俄亥俄州哥伦布市俄亥俄超级计算中心(OSC)的研究人员发现,不是每项模拟都需要传统的超级计算机。OSC主任兼生物医学应用部门的接口实验室研究科学家Don Stredney发现了超级计算机通常存在的一个局限性:批处理进程是静态的,只能在预定的时间段运行。它们无法提供实时的相互联系,所以无法模拟真实的外科手术。他表示,成本在6000美元到10000美元的桌面工作站使他的团队可进行手术模拟,实时显示外科手术是如何改变病人身体结构的。
Don Stredney表示,他所在的行业得益于计算机游戏领域的创新,因为普通的消费级GPU的功能已经变得极其强大,只要极低的成本就能得到非常逼真的效果。该领域的研究人员使用普通PC运行标准的GPU,比如来自AMD公司ATI部门和NVIDIA公司的GPU,但不是高端GPU集群。不过他们发现,当一些模拟中的数据集变得太大时,就需要重新使用超级计算机运算。Don Stredney表示,当出现数据集急剧变得非常庞大,或每一幅图像都有数GB大小,以及数据采集时通常为0.5TB大小的多尺度数据集这些情况时,他的团队会重新使用超级计算机。他表示,实时视觉和听觉模拟需要越来越大的数据集和复杂的相互联系,因而需要更高端的系统。
汽车设计
Autodesk公司汽车部门的Ed Martin经理表示,注塑模拟对汽车厂商来说很重要。注塑是指利用塑料材料制作零部件的一种工艺。模拟可显示注塑模(比如保险杠)会不会引起痕陷,注塑模与汽车其他零部件的配合度如何,模拟还能暴露出任何瑕疵。设计师要考虑许多变量,如注塑模温度、几何形状以及注塑工艺与某些材料的适合程度等。Ed Martin解释说,单单防护板的一个物理原型造价就超过100万美元,所以模拟越准确,需要制造的原型数量就越少,因而生产成本就越低。
Ed Martin说:“模拟过去需要安装大量的集群计算系统,但我们现在用当前的桌面计算机就能获得同样强的能力。”他表示,在这方面起到最大作用的桌面领域的一些进步包括:采用多核处理器、使用多个GPU以及64位吞吐量。Ed Martin使用的就是可以从沃尔玛买到的标准桌面计算机,它们配备了兼容3D的最新GPU和英特尔双核处理器。
汽车行业还使用桌面软件来为汽车设计制作模型。借助这类工具,汽车厂商就能制作出复杂的透视图,效果可与一流视频游戏中的图形相媲美,甚至更出色。值得关注的是,当这些模型在桌面PC上制作完毕后,常常可以用于营销资料和电视广告中。Ed Martin表示,完全可以将超级计算机上制作的模型传输到PC上,但如今PC之间传输文件来得更简单,因为文件格式在各应用程序之间是兼容的,如果通过标准网络来进行传输,则有可能将图形传送给数量更多的用户。
举一个在桌面上制作模型的例子。设计师常常建立车漆模型,认真观察金属片以及它们在某些塑料上的外观,或者观察车漆在某些光照条件下会不会显得没有光泽。模型越准确,它们的制作工艺就越集中。过去,因为车漆中使用的高分子材料大约有8000种,因此,高性能计算环境必不可少,Ed Martin表示,如今桌面系统就能胜任这种高速处理任务。
基于Web的计算搜索
HPC走向桌面最值得关注的途径之一就是经由Web。眼下这方面的最佳例子就是WolframAlpha网站,按该网站自己的话来说,就是互联网上的这个“计算知识引擎”旨在“收集和保存所有客观数据,能够计算可以计算的任何对象。”
这方面的巨大变化在于,虽然在WolframAlpha.com上进行的搜索还是在超级计算机上进行的,但搜索结果几乎可以马上返回到浏览器中。比如说,键入“moon”这个简单的字后,其系统就会开始一系列复杂的计算,计算月球相对地球的轨道以及一段历史时期内的平均距离。
沃尔夫勒姆研究公司(Wolfram Research Inc)的架构师Schoeller Porter表示,之所以能近乎实时地进行运算,那是由于HPC部件的成本降低了。在过去,这种复杂运算需要向超级计算机请求运行批处理任务,请求占用几分钟、几小时甚至一天的处理时间。这倒未必是由于运算本身需要很长时间,而是由于处理资源极其昂贵。
你不妨亲自试一下,往WolframAlpha搜索引擎中输入一些运算请求,比如询问6个月后檀香山的潮汐(tides in honolulu in 6 months),还可以输入类似以下一些运算请求:International space station jun 24(国际空间站,6月24日);skychart Timbuktu yesterday at 8:00pm(Timbuktu昨晚8点的星空图);y’’ sin y = x(数学表达式);GATTAACCC(基因组序列)等。
在WolframAlpha上进行搜索时,可以在桌面上随意改变任何一个变量。你会注意到,一些查询所花的时间比另一些查询来得长,这取决于超级计算机需要多久才能确定结果。
虽然谷歌搜索也依赖后端的超级计算机或集群,但它们所用的计算算法与WolframAlpha不一样。谷歌搜索信息后提供相关链接,WolframAlpha提供给用户的是实际信息,而不是链接,这些信息可能是从知识库获取的,也可能是由它执行的运算生成的。
天气预报
英特尔公司高性能计算软件解决方案部门主管Bill Magro表示,天气预报在过去的20年经历了重大变化,从原来的仅仅提供天气模式的概况变成翔实资料的显示,比如每个风暴中心的详细资料。之所以发生这种变化,主要是由于天气预报所需的庞大数据集现在可以放在桌面计算机的存储器中,其处理能力也有了突飞猛进。现在用于气象的部分天气模拟可以在地方电视台的桌面计算机上进行,而不是只能在监测天气的政府机构里才能进行。
天气预报的建模极其复杂,因为天气在开放的3D空间不断变化,在温度、位置、风力及其他因素方面有成千上万个变量。天气模型取一个空间范围,比如5000米的网格,一个数据点代表每个方向的每5000米,然后把它缩小到1000米,之后再缩小到500米。Bill Magro解释说:“因为从三个维度来缩小,计算要求则提高了8倍。不仅仅数据更多了,所建立的模型也更详细了。这其实说到底就是需要拥有足够的内存和足够的计算能力。”
桌面计算机已经开始用于一些地方电视台的天气模拟。未来,随着处理器技术的进一步发展,我们可以在PC上运行所有详细的个人天气预报。Bill Magro表示,到那时,个人可以使用桌面计算机来查看邻近地区的天气模式,或者根据遇到的天气状况和输入到模型中的天气状况,预测6个月后你想去的度假地的天气情况。
更多应用紧随而来
美国佐治亚理工学院(Georgia Institute of Technology)的高性能计算执行董事David Bader展望未来认为,在接下来的10年里,HPC的另外几种应用会出现在桌面端。
David Bader表示,现在有望发现社会网络当中出现的新趋势,或确认影响社会网络的关键因素。可以给出相应的建议措施,以改善诸多社会行为的能源效率,比如确定合理交通路线,以免堵塞;安排好计算机应用的运行时间,以便尽量减少能耗;监测智能电网等。其他发展前景,包括利用大量的公共照片来构建3D场景,利用发言人的身份证件实时记录电视电话会议的文字内容。
虽然专家们一致认为,特大型超级计算机将在今后存在一段时间,但另外哪些传统的HPC应用最终会出现在桌面端,很值得期待。
链接
桌面端的特效
虽然电影行业仍然依赖传统的高性能计算机来制作特效,但好莱坞在很早之前就采用64位工作站把制作特效的一部分工作转移到了桌面上。
电影《2012》和《阿凡达》等影片中的特效通常需要异常强大的处理能力,明眼人一看就知道,由计算机生成(以及消费级软件制作)的动画瀑布与真实的瀑布有着明显区别。工业光魔(Industrial Light and Magic)、Uncharted Territory工作室和梦工厂等电影公司依赖庞大的计算集群和多台服务器来制作特效,单单制作一帧视频就要花好几个小时。
计算机成像(CGI)特效需要强大的计算能力。运用技术让光均匀地照射到物体上,然后一起移动,仅仅在一个镜头中,屏幕上同时就有数百万个像素。Autodesk公司电影和电视行业经理Bruno Sargeant表示,着色器模型也起到了帮助作用,它相当于像素的催化剂,使用数学算法让像素的移动显得更逼真。
但高端工作站已经开始发挥作用。Adobe和Autodesk这两家公司都一马当先,让桌面计算机也能处理好CGI特效,而不需要庞大的多台服务器或集群。前者拥有64位Mercury渲染引擎,而后者一款名为Smoke的专业软件将在今年11月中旬向Mac Pro计算机推出。Bruno Sargeant表示,速度快得多的总线、多核处理器、固态硬盘和GPU加速,这些已经万事俱备。
瑞典业务开发咨询公司Artair Group的分析师Bjorn Andersson说:“电影特效领域的竞争极其激烈。一些电影的成功依赖它们首次使用了哪种开拓性、突破性的特效。这反过来依赖两个因素:一是能使用多强大的原始计算能力?二是开发新的软件功能。”