前不久,使用中國自主芯片制造的“神威·太湖之光”取代“天河二號”登上全球超級計算機500強排行榜榜首。其實在此之前,另一項世界紀錄也已“低調”產生,依托“神威·太湖之光”,利用自主研發的并行計算軟件ScETD-PF,中科院計算機網絡信息中心(以下簡稱中科院網絡中心)實現了使用全機系統900萬核的并行計算規模,實測性能達到峰值性能的40%,是目前世界上最大的并行計算,遙遙領先于國際同類計算機模擬水平。
可能大多數非業內人士并不能完全理解這一成績的意義,但在中國超算不斷沖擊世界第一桂冠的路上,除了贊譽和掌聲外,質疑和反思也一直沒有間斷過,比如高昂的能耗費用、實際利用率低、應用軟件開發周期過長、人才梯隊儲備不足等等。甚至有人尖銳的提出,占有量和運算速度誠然是一個“聽起來爽”的指標,但如果沒法用起來,再高的計算能力也只是一個讓人迷醉的數字。
“脫離軟件開發利用,超算就是一堆破銅爛鐵。同樣,光有高性能機器,沒有人才做高水平的服務,那機器過5年就過時了。”在中科院網絡中心副主任、計算科學應用研究中心主任遲學斌看來,除了要做好基礎研究、前沿研究之外,更要在超算應用的軟件通用性、行業專用性和軟件工程化等方面取得突破。
并行計算:20年獨磨一劍
對于超級計算機,中國與國外的建設方式略有不同,以美國為例,超級計算機的建設方研發的目的都是自用,一般是先有計算量需求,根據所需計算量設計系統,根據需求設計超級計算機的架構方式。而中國則是先進行建設,盡力提高性能,嘗試滿足更高的計算需求。
“其實無論是先用后建,還是先建后用,能滿足應用的計算機即是最佳計算機。尤其是千萬億次計算時代的到來,僅靠簡單地使用更多的處理核來執行原有的并行應用程序已不可能,這就需要對應用程序進行深度的并行優化,設計出性能更加優良的并行算法。”在遲學斌看來,中國超算的超前發展是技術發展的必然趨勢,但只有抓住并行計算這個“牛鼻子”,才能提高計算效率和應用領域。
從1997年開始,圍繞大氣、物理、化學、海洋、金屬材料等領域,中科院網絡中心一步步的完善自己的基礎算法庫,并在數學方法上進行創新。
“以此次現場模擬為例,為了與‘神威’系統緊密結合,從程序實現、軟件開發到大規模并行計算的實現和驗證用了近3年的時間,僅算法就寫了一萬多行。”中科院計算科學應用研究中心研究員張鑒告訴記者。
“一個超算中心在其生命周期之內,能夠解決一個問題,就有可能為某一個領域、某一個行業省下十幾年、幾十年的時間跨度,這個價值用錢沒法算。”遲學斌認為,超算應用的發展需要長期持續地投入和積累,才能在未來某一個時間看到明顯效果。
一組數字就很能說明問題,截至2015年12月,中科院超級計算環境已經面向用戶提供了計算物理、計算化學、材料科學、流體力學等多個領域的87個并行應用,累計開通外部賬號498個,累計提交有效網格作業逾55萬個,累計使用機時已超過1.2億CPU小時。
瞄準應用:搶占E級高地
打開中科院超級計算網絡環境部署圖,一個三層結構的超級計算環境已具雛形,“總中心—分中心—所級中心”聚合了逾千萬億次的計算能力,而且每層結構都建立了面向相關領域的系統運維與應用支持團隊。
“隨著神威26010軟硬件生態系統的不斷成熟,對應用平臺的需求更加多樣化的,要滿足不同類型用戶的需求,人才隊伍的多元化發展至關重要。在超算中心每個研究人員可以自行選擇喜歡的領域,我們沒有任務指標,也沒有考核,也不要求大家發文章。”遲學斌告訴記者。
在張鑒看來,這種組合方式就如同一支支隨時準備打仗的部隊,盡管大家專注的領域不同,但有一根弦始終緊拉著,那就是圍繞并行計算開展服務和研究,一旦有任務就能頂上去。
不求聞達、不事張揚是這支隊伍的真實寫照,但也正是有了這種支撐,中科院內外的許多科研工作才得以碩果累累。
數據顯示,“十二五”期間中科院超級計算環境用戶發表論文數量不斷攀升,各類論文共2724篇,其中絕大多數是SCI論文。更加可喜的是,中科院網絡中心基于“神威·太湖之光”的“鈦合金微結構演化相場模擬”成功入圍國際高性能計算應用領域最高獎——戈登貝爾獎提名。
“這不僅是中國團隊首次入圍,更打破了西方發達國家的壟斷,說明我們國家不僅能夠造好的計算機,也能用好計算機。”盡管在遲學斌的口中只是“造”和“用”的細微區別,但這一字卻凝結了中科院網絡中心人不忘初心的決心和堅持。
談及未來的研究重點,遲學斌說,“E級超算被全世界公認為‘超級計算機界的下一頂皇冠’,我們要搶占這個戰略制高點為其提供支撐服務,同時還要針對行業重大應用需求和企業重大目標進行產品開發,提供應用計算服務,研發并行軟件等等。”(李建榮)
湘ICP電子備案05014582號