最新一期全球超級計算機TOP500榜單今日公布,中國自主研發(fā)制造的神威太湖之光取代天河2號名列第一,這個消息立即刷爆朋友圈。中科院計算所研究員、中國計算機學(xué)會青年計算機科技論壇(CCF YOCSEF)主席韓銀和第一時間給出點評:
“太湖之光為啥這么牛?它擁有一顆巨強的“芯”-申威26010,上海高性能IC設(shè)計中心設(shè)計的國產(chǎn)高性能處理器。該處理器包含有260個處理核,單片峰值性能為3.06Tflops/s。天河-2單節(jié)點采用2個Intel Ivy Bridge處理器+3個Intel Xeon Phi類GPU加速器芯片,這5個處理器芯片峰值性能相加約為3.431Tflops/s,也就是說一顆申威芯片性能大致相當(dāng)于天河-2中Intel 5個芯片的峰值性能之和!”
韓銀和還總結(jié)了太湖之光的3個亮點:(1)總性能93P,比天河-2又快了3倍,比第3名美國橡樹嶺實驗室的機器快了5倍,是第一臺性能接近100P的機器;(2)采用了全國產(chǎn)眾核處理器;(3)能效比達(dá)到6GFlops/W, 和Green500第一的日本機器能效比也就差不到10%,但太湖之光比日本機器規(guī)模大多了,這么大個頭能效比控制的這么好,需要有獨到的技術(shù)。
6月20日,第 23 屆高性能計算(HPC)國際頂尖會議 ISC2016 在德國法蘭克福舉行,會上提前公布第 47 次 HPC TOP500 榜單,中國的神威太湖之光系統(tǒng)(Sunway TaihuLight System)排名第一。
神威太湖之光系統(tǒng)
在國家超級計算無錫中心1000平米的主機房內(nèi),整齊排布著兩組共40個運算機倉,每個機倉容納1024個芯片,共計40960個芯片。據(jù)介紹,其單芯片的計算能力相當(dāng)于3臺2000年全球排名第一的超級計算機,當(dāng)前性能指標(biāo)達(dá)到國際領(lǐng)先水平。
3 大突破
神威太湖之光由國家并行計算機工程技術(shù)中心研發(fā),在無錫國家超算中心安裝完成,2015年12月21日完成整機系統(tǒng)性能測試,目前由清華大學(xué)負(fù)責(zé)運營。
神威太湖之光運算峰值為 125.4 Pflop/s,持續(xù)性能 93 Pflop/s,比天河 2 號快了將近 3 倍,比排名第 3 的美國橡樹嶺實驗室的機器快了 5 倍,也是國際第一臺性能接近 100P 的機器。
美國Titan、天河二號、太湖之光參數(shù)對比
神威太湖之光每瓦特浮點運算次數(shù)達(dá)到了 6 億次(世界排名第 2 到第 6 的超級計算機,這個數(shù)值都在 2 億次左右),也即能耗比達(dá)到 6 Gflops/W,與 Green500 第一的日本機器相差不到10%,但太湖之光規(guī)模明顯更大,因此實現(xiàn)的技術(shù)獨到。目前,世界排名前 10 的其他超級計算機能耗比都在 2 Gflops/W 左右。
國家超級計算無錫中心主任楊廣文教授在接受采訪時表示,神威太湖之光一分鐘的計算能力相當(dāng)于全球72億人同時用計算器不間斷計算32年。
楊廣文說:“從低功耗、高集成度的處理器設(shè)計,到高速高密度的工程實現(xiàn)技術(shù);從世界領(lǐng)先的高效水冷技術(shù),到軟硬件協(xié)同、智能化的功耗控制方法,‘神威太湖之光’實現(xiàn)了層次化、全方位的綠色節(jié)能,功耗比達(dá)到每瓦特60.51億次運算。”
世界TOP6超級計算機參數(shù)
中國“芯”,No Intel Inside
ISC TOP500 榜單每年公布兩次,根據(jù)超級計算機基準(zhǔn)程序 LINPACK 測試值,評選全球最強超級計算機。
雖然我國處理器設(shè)計制造起步較晚、基礎(chǔ)薄弱,但通過近十年政府支持和大力投入,目前我國在超算領(lǐng)域已經(jīng)處于世界領(lǐng)先水平,也是繼美國、日本之后,第 3 個研發(fā)出超級計算機的國家。
位于廣州國家超級計算中心、由國防科技大學(xué)建造的天河 2 號,2013 年 6 月以 33.86 Pflop/s 的 LINPACK 測試值奪得TOP500 第一,并在接下來的 6 次榜單中蟬聯(lián)冠軍。
過去幾年,中國工業(yè)和研究部門注冊提交的系統(tǒng)數(shù)量劇增,中國現(xiàn)在入榜的超級計算機數(shù)量達(dá)到167臺,超過美國的165臺。
這也是TOP500榜單美國入圍的超級計算機總數(shù)量首次跌下第一位。
1993年至今中國TOP500超級計算機數(shù)量
1993年至今美國TOP500超級計算機數(shù)量
但由于天河 2 號采用了英特爾處理器,2015年4月,美國宣布對中國禁售高性能處理器。
這次,神威太湖之光使用我國自主研發(fā)和制造的 CPU 處理器——申威 26010(SW 26010),采用眾核+CPU架構(gòu),含有將近 1065 萬個內(nèi)核,主內(nèi)存 1.31 PB。
申威260140芯片
搭載了兩個核心組的電路板
SW 26010的芯片由上海高性能集成電路設(shè)計中心研發(fā),含有 4 個核心組,每組含有 65 個內(nèi)核,由64個計算核心(CPE)、一個管理核心(MPE)和一個內(nèi)存控制器構(gòu)成。
神威太湖之光核心組示意圖
64個計算核心排列為8x8的矩陣。4個內(nèi)存控制器總共提供了136.5GB/s的帶寬。
每組內(nèi)部有自己的專屬內(nèi)存空間,組間通過片上網(wǎng)絡(luò)(NoC)進(jìn)行通訊。片上網(wǎng)絡(luò)還連接著系統(tǒng)接口(SI),供芯片同外部設(shè)備通訊。
神威太湖之光架構(gòu)示意圖
神威太湖之光專為提升運算速度設(shè)計,簡單的架構(gòu)正是它運算速度勝過其他高能耗 HPC 系統(tǒng)的原因。
不過,申威芯片采用定制64位指令集,頻率處于中等水平(1.45GHz),而且每個核心只能執(zhí)行一個線程(不支持超線程),軟件支持也沒有Intel那么豐富。
但盡管如此,中國憑借一個完全基于中國設(shè)計、制造的處理器打造的新系統(tǒng),在國際TOP500組織第47期榜單上保持第一,TOP500聲明中這樣寫道。
實現(xiàn)零的突破
除了TOP500,戈登貝爾獎(Gordon Bell Prize)也是世界關(guān)注的重點。
戈登貝爾獎被喻為 HPC 應(yīng)用領(lǐng)域的諾貝爾獎,每年頒發(fā)一次,授予 HPC 領(lǐng)域杰出表現(xiàn)應(yīng)用,旨在記錄變形計算發(fā)展趨勢,尤其是獎勵高性能計算創(chuàng)新應(yīng)用。獲獎應(yīng)用多為性能峰值最高,或在可擴展性方面取得特殊成就,或縮短及重大科學(xué)或工程問題時間。
2016年的6項提名中,神威太湖之光占了一半,分別涉及大氣、海洋、材料三個領(lǐng)域的應(yīng)用:一個完全隱藏的非靜力動態(tài)解算機,用于云分解大氣層模擬;一個高效的全球表面波,用超高的分辨率進(jìn)行數(shù)值模擬;大規(guī)模的相場模擬,用于基于Cahn-Hillard方程的粗化動力,加上減少的移動性。
過去24年至今,世界排名第一的超級計算機
加速人工智能
航空航天、石油勘探、車船設(shè)計、軍事應(yīng)用、新藥研發(fā)、生物信息、氣候模擬……超級計算廣泛應(yīng)用在從實體經(jīng)濟到戰(zhàn)略領(lǐng)域的諸多方面。因此,超級計算不僅僅是學(xué)術(shù)研究,也涉及國家政治問題。
HPC 是世界各國競相角逐的科技制高點。
神威太湖之光采用中國自主設(shè)計和研發(fā)的芯片,在超算領(lǐng)域樹立了新的標(biāo)桿,在美國 X86 之外建立了新的生態(tài),可以說中國有了自己的產(chǎn)業(yè)鏈,未來還可能向其他國家輸出。
不僅如此,HPC 也是人工智能技術(shù)尤其是機器學(xué)習(xí)發(fā)展的關(guān)鍵之一,眾所周知,訓(xùn)練神經(jīng)網(wǎng)絡(luò)除了數(shù)據(jù),還需要巨大的計算能力。
神威太湖之光在 HPC 領(lǐng)域的成功,定能極大推動我國智能產(chǎn)業(yè)發(fā)展。
接下來,中國制造的神威太湖之光,將為全球提供超級計算服務(wù)。
(審核編輯: 滄海一土)
分享