首頁 > 科技 > 科技生活

美國重奪超算TOP500第一,中國還能反超嗎?

2018-07-03
來源:科學大院

 

  6月25日, “超級計算機500強”(TOP500)最新榜單正式發布。時隔五年,美國超級計算機“Summit”終于超越中國超算神威·太湖之光,重回第一。

  美國超算卷土重來意味着什麼?中國還有反超的機會嗎?超算未來的發展趨勢是怎樣的?為此,大院er訪問了中國科學院計算技術研究所的張云泉研究員。

圖1 6月25日公布的超算TOP500的前十名圖1 6月25日公布的超算TOP500的前十名

  問:在最近的超算排行榜上,美國多年後重回榜首,意味着什麼?

  答:超算TOP500每年發布兩次,我們國家的天河2號和太湖之光,分別六次和四次拿到冠軍,一共十次,相當于連續五年佔據了TOP500的冠軍位置。

圖2  超級計算機“神威·太湖之光”
圖2  超級計算機“神威·太湖之光”

  美國政府為此很着急。之前由于奧巴馬政府對超算不夠重視,奧巴馬只是在第二個任期快結束的時候才發布了一項總統令,加快超算研制的創新步伐。 而特朗普就任以後,卻對超算極其重視,在砍掉了很多科學研究預算的情況下,超算的預算不但沒砍,反而增加了。

  幾年前,美國部署了三台百P(相當于十億億次)量級的超級計算機,每秒的運算速度可以達到100P到200P左右,分別是Summit、Sierra、Aurora三台機器。目標有三個:第一當然是為美國的國家實驗室研發世界領先的超級計算模擬系統,保持美國科學創新的領導地位;第二是希望保持美國在超級計算機研制上的技術優勢和領先水平;第三就是希望把TOP500第一的位置奪回來。為此美國大概撥款了5個億美元的預算,計划在2018年年底推出第一台機器,重返Top500榜首。

  但是美國終究無法繼續容忍中國再霸佔世界TOP500的冠軍位置半年,將原來的計划提前了半年,于今年6月份就調整計划推出了Summit、Sierra兩台機器,作為雙保險爭奪世界第一,Summit直接將峰值性能提升到200P,終于如願奪回世界第一的位置,美國終于松了一口氣,重新找到老大的感覺。其實美國最早是想用峰值180P的Aurora來作為種子選手爭奪世界第一的,但是由于英特爾負責研制的新Xeon Phil加速器無法按期完成,只好修改合同,直接去研發2021年完成的百億億次超級計算機A21。

圖3 美國超級計算機Summit
圖3 美國超級計算機Summit

  問:中國在超算領域的實力到底怎麼樣?未來要解決哪些問題?

  答:如果畫一條中國超算的性能發展曲線的話,可以看到,中國的超算實際上是從一窮二白做起的。在2002年之前,TOP500上就沒有中國的超算,或者說中國超算本身就很少。從2002年之後,經過15年的高速發展,中國超算的上榜數量,包括性能都是指數級增長,以旱地拔蔥的方式一躍而起。

圖4 中國超算的跨越式發展
圖4 中國超算的跨越式發展

  原來是美日歐三大集團瓜分世界超算TOP500的前三名,像馬拉松一樣,他們平穩地跑在第一方陣。而中國就屬于從隊尾直接沖到了第一方陣中的選手,我們超過了第三名的歐盟,超過了第二名的日本,最後又超過了美國,成為世界第一。15年的時間很不容易,從一窮二白到最後成為世界第一,中國超算機器的研發水平,現在確實是世界領先的,處在第一方陣的靠前水平。

  但是我們也面臨很多的困擾,我們的機器發展比較快,但是相應的應用和軟件研制這塊有點滯後,沒有完全跟上,可能有投資原因,還有各種人才培養周期的原因。但是現在我們也在積極的解決這些問題,後期國家對軟件研發、對人才的培養都加大了投資力度。這些問題還需要5到10年的時間去解決,達到平衡狀態。

  中國超算走過了一條比較特殊的路,就是機器發展拉動應用需求,也就是說我們機器的水平是超過了應用需求的。這是一種政府主導的快速發展模式。這個路現在是比較成功的。我們機器發展比較快,也带動應用的水平快速提升。但是未來我們希望能夠用5到10年的時間,把這種發展模式轉變成應用需求來拉動機器發展,這樣更科學更合理。這種發展模式,也是西方發達國家現在的發展模式。

  現在來看,我們已經連續兩年拿了戈登貝爾獎(編者注:該獎設立于1987年,主要頒發給高性能應用領域最杰出成就,通常會由當年TOP500排行名列前茅的計算機系統的應用獲得),說明應用水平提高還是很快的!

圖5 中國團隊獲得戈登貝爾獎
圖5 中國團隊獲得戈登貝爾獎

  問:據說中國9月份就可以重回TOP500的榜首了,是真的嗎?

  答:這個絕對是謠言,中國至少在今年是不可能重回TOP500榜首的。美國會佔據排行榜第一名的位置大概至少兩年的時間,蟬聯四次冠軍是有可能的。

  至于在2020年有沒有可能?也許有可能。我國的計划應該是在2020年左右,憑借百億億次超級計算機重新去奪回世界第一的位置。但是能不能奪回來,也很難說,因為美國、日本、歐盟也在強化研制下一代的超級計算機,他們都是計划在2021年左右推出,到底最後第一是誰還不一定。

圖6 2020年,中美超算的競爭將繼續
圖6 2020年,中美超算的競爭將繼續

  近五年來,中國佔據了TOP500的榜首,原因之一是我們的發展道路(機器發展拉動應用需求),但是也有運氣成分,因為正好處在美日歐的低潮期。在這五年里,美日歐的研制計划都比較弱。日本國內對于要不要拿TOP500世界第一也有一些分歧,結果日本國會沒有撥款,所以日本的研發計划一再拖延。歐盟是因為它本身沒有實力自己研制,只能購買美日等國的產品。美國是因為正好處在奧巴馬政府不重視的時期,預算被調整,本身的研制周期也出了問題。所以我們找到個空檔,打了勝仗,這是難得遇到的歷史機遇。

圖7 超算TOP500中美國與中國的份額對比
圖7 超算TOP500中美國與中國的份額對比

  美國這次雖然拿了第一,但與中國的太湖之光所釆用的體系架構相比,並沒有本質的區別。太湖之光的峰值是125P,美國的Summit是187P,沒有量級上的性能差別。只是說由于Summit的投資力度大、研發時間晚,采用了新的工藝和技術,它的峰比太湖之光高一些,但是其在架構和技術上並沒有拉開差距。

  問:據說最新的天河3號和神威的原型機都要發布了,它們達到百億億次的水平了嗎?

  答:這個是媒體誤導,原型機很小,性能只有5P,也就是100P的1/20。只是一個測試性的樣機,為未來的百億億次超級計算機探索技術路線圖的,並不是最後的百億億次機。

  問:下一代的超級計算機就是百億億次超算,會用到什麼特別新的技術嗎?

  答:現在全球的各個國家又重視超算了,都在重新調整戰略。新一代的百億億次競爭就會從2020年開始。到底哪個國家先做出來?

  百億億次超級計算機的最大的問題就是功耗控制,需要在半導體工藝上有很大的突破,才有可能把功耗控制在30兆瓦左右。如果說功耗控制沒有發生革命性的降低,以現在的技術去搭建的話,它的功耗可能會達到一百兆瓦,就沒法用了。電費也太貴,1年的電費相當于十億人民币。所以國際上的競爭就是看誰有本事在30兆瓦的功耗預算的前提下,能夠造出百億億次超級計算機,這個是目前最大的挑戰。

  問:說到超級計算機,我們總是“不明覺厲”,它到底能用來干什麼?

  答:超級計算機簡單的說就是“算天算地算人”,它的運算范圍可以說是天文地理無所不包。

圖8 超級計算機運算范圍無所不包
圖8 超級計算機運算范圍無所不包

  第一個方面是滿足國家戰略的運算需求,比如說核武器核力量研發、核反應堆的研發。

  第二個方面是參與國家信息安全情報的大數據處理。

  第三個方面是科學計算,研究各種科學問題。比如宇宙的演化、汽車的碰撞、藥物的設計……方方面面的研究都會用到超級計算機。比如說,如果沒有超級計算機,天氣預報的水平就會跟不上的,精度也不夠,准確率也不高。

  第四個方面是大數據和人工智能。現在的人工智能研究大量地采用超級計算機的異構加速體系架構,很多互聯網公司也在用GPU搭建大量超級計算機。

  從這四個角度來說,它都有很大的作用。超算正越來越多的滲透到各行各業中去。

  現在還出現了新的趨勢,就是在這一輪的科技創新中,大數據、云計算,人工智能、區塊鏈,還有邊緣計算等等,這些熱詞的背後全都需要超強的計算能力,我們叫做算力經濟。一個地方想發展新的高科技,如果沒有很強的云計算平台或超級計算平台,算力經濟的創新性都無從談起。所以說,超級計算機在中國新的發展、新的科技創新中都是極為重要的一環。

[責任編輯:肖靜文]
網友評論
相關新聞
返回頂部 關閉