資料圖:超級計算機本身的計算和冷卻需要巨大的能源支撐,現(xiàn)有的技術(shù)打造艾級超算耗能將更高,或需要一個發(fā)電站對其供能。
【環(huán)球軍事報道】IT領(lǐng)域的摩爾定律認(rèn)為,計算機性能每18個月就將提升一倍。中國“天河二號”超級計算機在世界超級計算機排行榜上連續(xù)3次奪得冠軍,固然值得慶賀,但另一方面也顯示,超級計算機的技術(shù)陷入瓶頸狀態(tài)。
張云泉介紹說,以往超級計算機通過增加處理器數(shù)量就能不斷提高性能。但美國勞倫斯·伯克利國家實驗室的豪斯·費姆尼教授認(rèn)為,最近幾年超算技術(shù)上的發(fā)展,都不足以突破艾級超算的障礙。原來認(rèn)為2018年就能實現(xiàn)1000P級別的超算,現(xiàn)在推遲到2020年,甚至2022年都無法實現(xiàn)。
超算發(fā)展目前面臨的挑戰(zhàn)首先是功耗控制難。目前的集成水平和此前相比并沒有根本性改善,以現(xiàn)有技術(shù),艾級超級計算機的功耗會超過20兆瓦,建造費用將超過2億美元,這將帶來一系列技術(shù)和運營問題。例如“天河二號”一年僅電費就要1億元人民幣,全速運算的話,電費更高達(dá)1.5個億。如果還是按照老思路,依靠增加規(guī)模制造出的艾級超算,功耗可能會達(dá)到50-100兆瓦,這需要有一個專門的核電站來給它供電,這樣的超算顯然沒有實用價值。同時這樣密集排列的大功率處理器,也會帶來無法解決的散熱問題。因此國際上公認(rèn)的艾級超算標(biāo)準(zhǔn)是,功耗必須控制在20兆瓦內(nèi),這就要求在制造工藝上有革命性突破。
其次是可靠性問題,將來超級計算機并發(fā)部件將超過10億,以現(xiàn)在的故障率,平均每過10-20分鐘系統(tǒng)就會報一次硬件錯誤,而每次處理錯誤需要半個小時。這顯然也是無法容忍的。
第三,超算還面臨數(shù)據(jù)的訪問速度限制?,F(xiàn)在超級計算機運行的速度越來越快,但現(xiàn)有存儲器讀取數(shù)據(jù)的速度卻已無法跟上需求,也成為超級計算機性能提升的瓶頸。因此美國也有一批教授認(rèn)為應(yīng)該反思超算的發(fā)展方向,改變追求峰值運算速度的模式,而注重實用價值。例如放棄通用型超算,而是根據(jù)實際需求定制超算。
第四,超算要取得更長遠(yuǎn)發(fā)展需要解決架構(gòu)難題。王恩東認(rèn)為,如何開發(fā)更加創(chuàng)新的系統(tǒng)架構(gòu)從而突破性能瓶頸,使超算性能從千萬億次上升到百億億次,這是全球超級計算機專家都關(guān)心的話題之一。去年在上海交通大學(xué)上線運行的中國高校第一超級計算機就使用了浪潮和上海交大共同開發(fā)的CPU+GPU+MIC的創(chuàng)新技術(shù)架構(gòu),目前這種架構(gòu)被普遍認(rèn)為是突破P級到艾級最有可能的方法。(劉 揚)
相關(guān)新聞
更多>>