超算有什么用

中超02
超算有什么用
导读:问题一:什么是超级计算机?超级计算机有什么用处? 呵呵。超级计算机就是科学计算机。比如神州7号发射轨道的计算,举个例子,你用你们家的电脑算可能需要70年左右的时间。但是用我们国家研发的超级计算机4号只需要3个多月。 超级计算机和普通计

问题一:什么是超级计算机?超级计算机有什么用处? 呵呵。超级计算机就是科学计算机。比如神州7号发射轨道的计算,举个例子,你用你们家的电脑算可能需要70年左右的时间。但是用我们国家研发的超级计算机4号只需要3个多月。

超级计算机和普通计算机的区别在于运算次数的差距。我国超级计算机目前峰值性能为每秒计算1206万亿次。 超级计算机通常是指由数百数千甚至更多的处理器(机)组成的、能计算普通PC机和服务器不能完成的大型复杂课题的计算机。为了帮助大家更好的理解超级计算机的运算速度我们把普通计算机的运算速度比做成人的走路速度,那么超级计算机就达到了火箭的速度。在这样的运算速度前提下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。 相关资料: baikebaidu/view/296324

问题二:超级计算机能干什么用 超级计算机通常是指由数百数千甚至更多的处理器(机)组成的、能计算普通PC机和服务器不能完成的大型复杂课题的计算机。为了帮助大家更好的理解超级计算机的运算速度我们把普通计算机的运算速度比做成人的走路速度,那么超级计算机就达到了火箭的速度。在这样的运算速度前提下,人们可以通过数值模拟来预测和解释以前无法实验的自然现象。

随着超级计算机运算速度的迅猛发展,它也被越来越多的应用在工业、科研和学术等领域。我国现阶段超级计算机拥有量为22台(中国内地19台,香港1台,台湾2台),居世界第5位,就拥有量和运算速度在世界上处于领先地位,但就超级计算机的应用领域来说我们和发达国家美国、德国等国家还有较大差距。如何利用超级计算机来为我们的工业、科研和学术等领域服务已经成为我们今后研究发展的一个重要课题。超级计算机是一个国家科研实力的体现,它对国家安全,经济和社会发展具有举足轻重的意义。我国超级计算机及其应用的发展为我国走科技强国之路提供了坚实的基础和保证。

问题三:超算会用什么GPU 英特尔NV还是AMD 天河二号用英特尔至强E7,神威太湖之光(目前世界之一)用申威处理器

问题四:超级计算机真的很有用吗 普通人用不到。国防科研单位用的多,但是大数据时代,超级计算机去处理那些数据为我们提供道路交通天气信息也越来越融入我们的生活。

问题五:超级计算机到底有何用 超级计算机用处:

问题六:中国超级计算机惊人排名曝光,超级计算机有什么用 超级计算机一般用来进行高速度和高性能计算。

1、天气预报;

2、人造卫星发射;

3、导弹弹道计算;

4、云计算等等。

问题七:超级电脑有什么用途?用来计算什么? 电脑用来计算什么要看软件,安装地震测算的就是计算模拟地震的。安装天气模型的就是预报天气,安装石油勘探的软件就是分析勘探数据找石油的~~~

问题八:中国的超级计算机被用来干什么了 科学计算,动画渲染,天气预测,交通预测,还有研发产品的模拟计算(比如飞机的空气动力学模拟)之类的

问题九:超级计算机有什么用? 超级计算机对国防,科学研究都是必要的。现在超级计算机的水平影响甚至决定着前沿科技的发展。至于个人计算机这么处劲,是因为我们起步较晚。

问题十:超级计算机天河二号有什么用 世界上计算最快的计算机,貌似还得了奖,反正这算是中国的骄傲吧,从政治角度来说,中国在逐渐向发达国家进发,科技正在强盛。从科技角度说可以给导弹或一些超级武器,航天领域,提供技术支持

计算机的发展表现为四种趋向:巨型化、微型化、 *** 化和智能化。

1、巨型化。

巨型化是指发展高速度、大存储量和强功能的巨型计算机。这是诸如天文、气象、地质、核反应堆等尖端科学的需要,也是记忆巨量的知识信息,以及使计算机具有类似人脑的学习和复杂推理的功能所必需的。巨型机的发展集中体现了计算机科学技术的发展水平。

2、微型化。

微型化就是进一步提高集成度,利用高性能的超大规模集成电路研制质量更加可靠、性能更加优良、价格更加低廉、整机更加小巧的微型计算机。

3、 *** 化。

*** 化能够充分利用计算机的宝贵资源并扩大计算机的使用范围,为用户提供方便、及时、可靠、广泛、灵活的信息服务。

4、智能化。

智能化是指让计算机具有模拟人的感觉和思维过程的能力。智能计算机具有解决问题和逻辑推理的功能,知识处理和知识库管理的功能等等。

当前,世界上凡是有能力研制巨型机的厂商,已大多转向研制并行机或者是研制向量技术与并行技术相结合的向量处理机高度并行化的系统,如vpp500等。总之,超级巨型机系统结构离不开并行处理技术,并行机将逐步取代传统型向量机。大规模并行处理机正值年富力强的壮年时期,技术上已趋于成熟,因而有条件、有基础、有能力担负起攀登万亿次、百万亿次,甚至于更高量级超级计算机的历史使命。万亿次量级的超级计算机有望在今年年内问世。 诚然,并行机在今后的发展史上,在前进的历程中,还会有许多诸如应用软件不丰富,运算效率不高,高档次代表mpp风格的大系统实际用户还很少等等现实问题。尽管如此,但决不会影响并行处理技术的进一步发展。因而,并行处理技术及其产品大规模并行机系统的竞争是激烈的,前途是光明的,攀登万亿次量级超级计算机的历史使命是能够如期完成的。

超级计算机是计算机中功能最强、运算速度最快、存储容量更大的一类计算机。日常经济、科技、国防等领域存在一系列复杂、大型的被称为“挑战性问题”,这类问题都必须依赖同时代中运算速度最快的“超级计算机”。而超级计算机 多用于国家高科技领域和尖端技术研究,是国家科技发展水平和综合国力的重要标志。

12月8日,国家超级计算天津中心和国防 科技 大学联合数十家合作团队,共同发布面向新一代国产E级超级计算系统的十大应用挑战,支撑解决世界 科技 前沿、经济主战场、国家重大需求、人民生命 健康 领域的重大挑战性问题。

新一代百亿亿次(E级)高性能计算机的研发,是国家在新一代信息技术领域的重要部署,将有力驱动国家信息技术产业创新发展,其自主化程度远高于其他超算平台,同时规模与性能更是大幅提升。此次十大应用挑战的发布,就是为了充分发挥新一代E级高性能计算机强大计算能力,研发适配国产超级计算系统的关键技术和应用软件,构建新的国产E级超级计算应用生态。

十大应用挑战包括:磁约束聚变堆全装置聚变模拟(人造小太阳)、全尺寸航空航天飞行器超百亿网格计算流体力学模拟、数字细胞超亿级原子体系动力学模拟、对流尺度次公里级精细化数值天气预报、面向通用人工智能的超大规模预训练模型、面向通用人工智能的超大规模预训练模型、FAST超大规模观测数据的高分辨率巡天图像处理、全球尺度地震全波形反演、全脑千亿神经元动力学仿真、完全分辨率的全球次中尺度海洋数值模拟。

国家超级计算天津中心党组书记、天河超级计算机应用研发首席科学家孟祥飞表示,此次发布的十大应用挑战,充分体现了超级计算创新坚持“四个面向”的引领和驱动,未来通过重大应用挑战的破解,超级计算将持续发挥驱动高质量发展的国之重器的作用。

编辑/范辉

12月8日,国家超级计算天津中心和国防 科技 大学,联合数十家合作团队,共同发布“面向新一代国产E级超级计算系统的十大应用挑战”,支撑解决世界 科技 前沿、经济主战场、国家重大需求、人民生命 健康 领域的重大挑战性问题。

据介绍,新一代百亿亿次(E级)高性能计算机的研发,是国家在新一代信息技术领域的重要部署,将有力驱动国家信息技术产业创新发展,其自主化程度远高于其他超算平台,同时规模与性能更是大幅提升。此次十大应用挑战的发布,其目的就是为了充分发挥新一代E级高性能计算机强大计算能力,研发适配国产超级计算系统的关键技术和应用软件,构建新的国产E级超级计算应用生态。

挑战一:磁约束聚变堆全装置聚变模拟(人造小太阳)

可控聚变能源被认为是人类未来应对能源和环境挑战最有效的手段之一,而在磁约束聚变装置设计中,最重要的问题就是如何用更低的成本约束住更高密度、温度的等离子体。

目前被广泛认可的一个主要限制约束性能的机制是边界和芯部产生的所谓微观不稳定性。在先前的研究中由于多时间尺度的问题,这些不稳定性通常采用回旋动理学或磁流体力学等简化模型来描述,并且等离子体芯部和边界需要分别建模。

在新一代国产E级计算机上,将可以直接采用电磁全动理学这一经典等离子体最基本的模型来直接模拟可分辨离子回旋半径的磁约束聚变堆全装置等离子体,并且不用区分边界与芯部。借助几何算法,使系统长期演化模拟结果的可靠性可以得到保证,更准确而自洽地再现其内部所发生的不稳定性过程,寻求提升磁约束聚变装置约束性能的机制。

此外,全装置等离子体动理学模拟还能得到对装置尺度的等离子体演化更加保真的模型,更好地指导未来磁约束聚变堆等离子体的设计,将为可控聚变研究和聚变能源开发提供强力支撑。

挑战二:全尺寸航空航天飞行器超百亿网格计算流体力学模拟

近年来的临近空间飞行器复杂流动问题数值研究对认识高空高速下的流动机理起到了重要作用。临近空间飞行器飞行包络覆盖连续流域、滑移流域和过渡流域,存在复杂的气动力热、稀薄非平衡效应、大动压下的多体分离、化学反应、等离子体等跨流域非定常多场耦合现象。

上一代超级计算机在计算能力和架构设计上无法进行满足精度和效率要求的临近空间飞行器跨流域非定常多场耦合模拟,而新一代国产E级超级计算机在理论上有望突破计算瓶颈,从而实现超百亿网格高精度全尺寸这一模拟。

临近空间飞行器跨流域非定常多场耦合模拟研究一方面可以帮助我们全面认识飞行器在高空高速飞行状态下的复杂耦合流动现象,并辨识流动机制及其对飞行器的影响,另一方面可以拓展新一代超级计算机上的数值风洞构建能力,为航天各类运载飞行器和航空国产大飞机等设计提供载体,使其更好地服务于我国战略发展和建设。

挑战三:数字细胞超亿级原子体系动力学模拟

在解读生命奥秘特别是细胞生物机理方面,全原子分子动力学模拟的虚拟实验作用日益凸显。

细胞内充斥了各种各样的生物大分子和小分子,始终处于一种动态的拥挤环境中,而拥挤环境对生物分子的扩散、聚集、构象变化和化学反应都会有显著影响。因此,在细胞尺度上对生物体系进行全原子分子动力学模拟将是认知生命过程的重要手段,但是目前的计算机很难提供足够的算力来实现。

国产新一代的E级超级计算机理论上可以实现超亿级甚至十亿级原子数字细胞的分子动力学模拟,使得未来细胞水平上的精准模拟成为可能。对细胞进行全原子分子动力学模拟,将使我们可以在虚拟实验中对整个细胞及其内外的生物大分子的微观动态过程进行高时空分辨的观察,帮助我们全面深刻地去认识新冠病毒等如何侵入细胞、细胞如何进行物质信息交换等生命科学重大挑战性问题。

通过数字模拟获得的知识,也将对未来的新药研发、生命 健康 保障起到奠基性的作用。

挑战四:对流尺度次公里级精细化数值天气预报

对于尺度较小、发展剧烈的强对流天气系统,往往难以预报,且容易造成破坏性灾害,对于大城市的运行管理带来很大的威胁。

随着天气系统时空尺度的缩小,大气的混沌属性越发明显,预报的不确定性加剧,这为精细化天气预报带来了很大的挑战,目前基于探测技术的预警时效性和对系统演变的预测往往不足。

基于新一代国产E级超级计算机的强大计算能力,综合超高分辨率模拟、 *** 预报、快速循环等技术,提前0-6小时预报强对流天气的触发、演变、消亡,为单个对流系统提供连续、概率性的预测,改进强对流引发的局地强降水、冰雹、突发大风、龙卷的时空落区预报准确性。

挑战五:百亿级高效高通量虚拟药物筛选

先导结构的发现和优化作为新药发现阶段的研究核心,往往需要花费数年时间以及高达数亿美元的资金,是药物研发的关键技术瓶颈。因此如何生成新分子及优化分子的关键属性(如生物活性、成药性、安全性和选择性等)是影响药物分子设计成败的两个关键问题。

据估计,目前可利用的化学空间大小范围约为10^23至10^60,即便是某些成熟数据库的小分子数量也达到十亿级别。如何在如此巨大的化学空间内如何进行分子的智能生成、结构的快速演化搜索和性质预测是药物筛选所面临的巨大挑战。

目前,药物筛选通常可以利用分子对接等相对粗略的 *** ,在之前的超级计算机上已经可以实现对十亿级别的小分子进行快速的初筛,再利用更为精确的自由能扰动计算等 *** 进行更为准确的评价分析。

新一代E级超级计算机提供的强大算力能够支撑百亿级别药物小分子的快速筛选,辅以更先进的算法,可以实现虚拟药物筛选效能几十乃至上百倍的提升;同时高效的药物筛选,还可以与中药有效组分发现结合,推动中药研发的现代化。

挑战六:面向通用人工智能的超大规模预训练模型

深度神经 *** 是新一代人工智能的领航区,并且已经成功应用于计算机视觉和自然语言处理等领域,取得了突出成效。

随着应用场景的丰富和发展,传统基于有标注数据集的领域模型训练和应用范式越来越无法适用人工智能应用的开发和普及。基于无标注数据的自监督学习技术和综合能力好、通用能力强的大规模预训练模型的出现,将数据驱动的深度学习技术和通用人工智能推向新的发展阶段。

近年来,计算机和人工智能领域的专家和企业已经在利用现有高性能计算机上完成了 175 万亿参数的多模态预训练模型开发,而国产新一代 E 级超级计算机使得支撑参数规模更大、通用性更强的模型(十万亿甚至百万亿以上)的训练和应用成为可能。

大规模预训练模型的研发部署,一方面,将推动类人机器人加快落地;另一方面,有通用模型做基础,将大幅降低细分领域数据向智能化模型转化的难度,有效推动人工智能应用基础设施的构建,提升工业现代化、数字经济发展、智能 社会 数字化治理能力。

挑战七:FAST超大规模观测数据的高分辨率巡天图像处理

中性氢巡天是 “中国天眼”(FAST射电望远镜)的重要科学目标之一,通过探测可观测宇宙范围内中性氢的分布情况,为宇宙起源与演化、暗物质与暗能量等前沿科学领域的研究提供支撑。

受视场所限,望远镜每次观测只能覆盖有限天区,中性氢巡天观测持续时间可达数年,所积累的观测数据需拼接融合才能获得完整的高分辨率巡天图像。在中性氢巡天数据处理流程中,网格化(Gridding)是计算量更大且I/O最为密集的环节,是制约中性氢巡天数据处理与成果产出效率的瓶颈。

新一代E级超级计算机的数据处理能力配合高性能网格化算法,能够应对PB量级的中性氢巡天观测数据,从而为国之重器“中国天眼”能够“早出成果、多出成果,出大成果、出好成果”提供强大助力,促生天文学基础与前沿领域的重大发现。

挑战八:全球尺度地震全波形反演

地震全波形反演是当前分辨率更高的成像 *** ,是研究地球内部结构和动力学演化过程的强有力工具,还可为矿产资源和油气勘查提供关键支撑。

在过去十年里,地震科学领域专家已经在上一代超级计算机上实现了区域尺度的低频带弹性波全波形反演研究。

国产新一代的E级超级计算机将可以实现全球尺度的、包括地震波衰减特征在内的高频带粘弹性地震波场传播模拟和波形成像研究。全球尺度高频带粘弹性地震波形反演一方面可以获得地球内部高精度成像结果,加深我们对板块构造、俯冲带和造山带形成和演化的认识,另一方面可以提供地球内部各圈层(中下地壳、岩石圈、软流圈等)物质和能量交换的地震学证据,为研究地球深部成矿作用和火山/地震活动提供依据,帮助人类更全面的认知地质演化,理解类地行星的形成发展。

挑战九:全脑千亿神经元动力学仿真

近年来的神经科学研究获取了大量的大脑结构和活动的数据,以此来理解大脑的工作机制。对于大脑的高级功能,如运动控制和思考等功能的解析和再现,迫切需要建立起人类全脑规模的仿真神经 *** 平台。

人类的大脑有860亿神经元,在过去的十年里,计算神经科学领域的专家在上一代的超级计算机上已经进行了人脑百分之一大小规模的脑回路仿真。而新一代的E级超级计算机在理论可以实现包括大脑皮层、小脑和基底神经节在内的全脑神经回路的模拟。

人类全脑回路的仿真和研究,一方面在可以帮助我们理解大脑的思考等高级功能,开发类脑人工智能算法。另一方面,帕金森症,亨廷顿舞蹈症等大脑疾病的发病机理也将能够得到进一步的分析和验证。此外,使用仿真脑模型构建基于脉冲神经 *** 的神经模态机器人,能够提升现有机器人系统的感知与决策水平。

挑战十:完全分辨率的全球次中尺度海洋数值模拟

气候变化是全球可持续发展所面临的重大挑战,也是科学界面临的更具挑战性的科学问题之一,海洋则是控制气候系统季节内、季节、年际、年代际变率的重要分量。

近年来,随着海洋观测的飞速发展,海洋中尺度、次中尺度过程的许多机理被不断揭示,海洋多尺度相互作用的特征更加清晰,对海洋环流数值模拟也提出了更高的要求,分辨率中尺度、次中尺度过程及其与大气的相互作用成为重要的研究方向。

在过去的10年期间,全球的科学家在此方向作出了不懈努力,将全球的海洋模拟提高到部分分辨率次中尺度涡(2km)的分辨率,而我国的科学家也自主开发了全球3-5km的海洋模式,基本可以完全分辨开阔大洋的中尺度过程。新一代的E级超级计算机可以实现完全分辨率次中尺度过程的模拟,帮助科学家全面理解海洋内部多尺度相互作用过程,以及海洋能量串级过程,并进一步提高对海洋环流以及整个气候系统的模拟能力。

编辑/范辉

1、情报战

超算重要应用在情报收集、破解领域,超算能力领先,原来能破解64位密码,现在升级了就可以破解128位的,就可以强行攻破对方的安全系统,拿到情报。

另外超算也善于筛选情报,棱镜计划显示,美国花巨资收集各国隐私,包括普通百姓的海量信息,这就需要及时处理海量信息,特别是反恐具有时效性,尽快筛选出有价值的情报,超算就显出巨大的价值。

2、核武器安全

对于美国而言,超算作用首先在于研制核武器,美国许多的超算都参与维护核武库安全工作。通过超算建立核爆炸数学模型,深入了解核爆炸原理,研发新一代核武器。

3、引领信息技术潮流

超算是计算机信息化发展的引领者,很多处理器技术、虚拟化技术、量子计算等,都是最早为超算服务,之后才普及民用。

目前的云计算和大数据,计算能力也需要超算技术的支持。云计算是同时运行大量的小任务,任务之间没有什么关系,业内称为高吞吐量的计算。大数据做数据挖掘,以图算法为主。而超级计算的要求更高,它追求性能,要在最短时间内计算出单个任务。它们背后都是计算能力的要求,因此也可称为广义超算。

4、天气预报

天气预报准确度的提升,背后都是超算的功劳。下不下雨关键看云层运动,没有超算之前,观测云层精度是按照经纬度,有了超算之后,可以对云层运动进行精确模拟和观测。

5、找飞机、抓偷排

寻找失事飞机,大量的卫星雷达采集到信息后,数据处理就需要交给超算。只要有足够精确的相关数据,就能寻找到目标。

通过超算模拟,可以根据目前污染物的情况,计算出未来一段时间的大气污染物浓度和分布,进行空气质量预报。从预报结果还可以计算出哪些污染源“贡献”更大,了解污染的来龙去脉,为污染防控提供决策指导。

6、医疗应用

超级计算机,既可以进行基因测序,从根本上破解人类生命的“密码”,从基因修补的角度来避免很多先天性疾病,也可以在几百万的药物成分中,选择最合适的配比进行新药物的开发。

1先谈谈同构计算和异构计算。同构计算是使用相同类型指令集和体系架构的计算单元组成系统的计算方式。同构超算只单纯使用一种处理器,日本超算“京”只采用的处理器是富士通制造的SPARC64 VIIIfx,神威蓝光只采用了8704片申威1600,Mira和Sequoia(Sequoia采用了约160万个A2处理核心),就只采用了PowerPC A2处理器,这些都没有采用GPU或众核芯片等加速器。日本的京,IBM 的Mira和Sequoia和中国的神威蓝光都是同构超算的代表。

异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。异构计算是一种并行和分布式计算,它或是用能同时支持simd方式和mimd方式的单个独立计算机,或是用由高速 *** 互连的一组独立计算机来完成计算任务。具体来说,异构计算是在运算中既使用处理器,又使用GPU或众核芯片等加速器。以美国泰坦和中国天河2号为例,泰坦有18688个运算节点,每个运算节点由1个16核心AMD Opteron 6274处理器和1个NVIDIA Tesla K20加速器组成,共计299008个运算核心;

天河2号有16000个计算节点,每个节点由2片Intel的E5 2692和3片Xeon PHI组成,共使用了32000片Intel的E5 2692和48000片Xeon PHI;天河1A使用了14336片Intel Xeon X5670处理器和7168片NVIDIA Tesla M2050高性能计算卡。除了泰坦和天河2号和天河1A之外,曙光6000也是采用了异构计算架构。

(曙光6000)

2超算的用途

要说异构计算的优势,那就要从超算的用途说起了。

PC在日常使用中,除玩游戏、3D渲染等之外,大多是程序都倚重整数运算性能。

但超算则不同,超算大多应用于科研和军事领域。例如弹道计算、核物理研究、气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、动漫设计、工业设计等方面,在运算中更加倚重双精浮点性能,对整数运算性能要求相对较低。这就产生了用加速器提升浮点运算性能的需求。

3同构超算的高效率

同构超算虽然理论双精浮点性能不如异构超算,但可以获得较高的运行效率。异构超算虽然理论双精浮点性能非常强悍,但运行效率不如同构超算。

(Sequoia,采用PowerPC A2处理器)

举例来说,IBM Mira和Sequoia使用PowerPC A2处理器,效率达853%和856%。日本的京效率更是高达929%。

而异构超算效率普遍不高,采用E5和XeonPHI的天河2号和Stampede效率为617%、607%。采用AMD Opteron 6274和NVIDIA Tesla K20的Titan效率为649%。

天河2号和Stampede效率不高的一个重要因素就是Xeon PHI的浮点运算效率较低。在谈这个问题前,先释下linpack测试。

(Stampede)

衡量芯片性能的一个重要指标就是计算峰值,例如浮点计算峰值,它是指计算机每秒钟能完成的浮点计算更大次数。包括理论浮点峰值和实测浮点峰值:

理论浮点峰值是该计算机理论上能达到的每秒钟能完成浮点计算更大次数。

理论浮点峰值=CPU主频×CPU每个时钟周期执行浮点运算的次数×系统中CPU核心数目。

实测浮点峰值是指Linpack测试值,也就是说在这台机器上运行Linpack测试程序,通过各种调优 *** 得到的更优的测试结果。

在实际程序运行过程中,几乎不可能长时间维持在实测浮点峰值,理论浮点峰值更是仅仅存在于纸面上的数据。理论浮点峰值和实测浮点峰值只是作为衡量机器性能的一个指标,用来表明机器处理能力的一个标尺和潜能的度量。

回归正题,Xeon PHI在运行linpack测试时,实际性能仅仅相当于理论更大运算性能的百分之六十几,相比之下,申威1600的linpack测试效率远高于Xeon PHI。

但因Xeon PHI的理论浮点性能较高达1T Flop,大大超过申威1600的双精浮点运算的理论峰值,因此即使仅仅只有百分之六十几的效率,实测双精浮点运算性能还是大幅超越申威1600。因而使Xeon PHI得到了国防科大等单位或公司的青睐。

因此,同构超算的效率相对高于异构超算,而天河2号效率偏低的原因更多的是Xeon PHI本身效率较低,不是国防科大的技术问题。

4同构超算编程更方便

cpu适合做串行,逻辑复杂度高的任务,gpu适合做简单,并行度高的任务,cpu和gpu的编程模型是不一致的;所以异构超算在编程方面就不太容易,比如使用amd的apu和nvidia的cpu+gpgpu在编程上就不如同构超算方便。另外,gpgpu作为加速卡和cpu是不共享内存的,需要程序员显式拷贝而导致性能损失。

另外,因软件方面的原因,异构超算的通用性相对于同构超算有所不如,举例来说,GPGPU只能跑OPEN CL、OPEN ACC代码,不能跑OPENMP代码。

5异构计算的优势

以天河2号的一个计算节点为例:

Xeon E5的满载功耗达145W,双精浮点为021T Flops,而Xeon PHI功耗300W,双精浮点达1T Flops。

天河2号一个计算节点由2片Xeon E5和3片Xeon PHI,理论双精浮点性能为32T Flops,功耗为1190W,理论双精浮点性能与功耗的比值为287GFlops/W。相同功耗下使用8片Xeon E5只能获得1696Gflops的理论双精浮点性能,理论双精浮点性能与功耗的比值为142GFlops/W。从数据可以看出,在同等功耗下,在使用Xeon PHI加速后,理论双精浮点性能与是只使用Xeon E5的2倍。

因此,相同功耗的情况下,异构超算能获得非常高的理论双精浮点性能。

综上所述,同构超算的编程方便,效率高,通用性强。异构超算编程麻烦,效率不如同构超算,通用性差,性能功耗比高。异构超算虽然在通用性和效率方面相比同构超算处于劣势,但更加好的性能功耗比使其成为更受偏爱的原因。