湘江畔的國防科技大學(xué)正值暑期,校園里靜悄悄的,但校內(nèi)的 “天河”大樓機(jī)房內(nèi)卻一派熱鬧景象。長達(dá)數(shù)十米的機(jī)箱整齊排列著,發(fā)出高速運(yùn)轉(zhuǎn)的低沉“嗡嗡”聲,指示燈明暗交錯(cuò),“天河二號”副總設(shè)計(jì)師肖立權(quán)正帶領(lǐng)團(tuán)隊(duì)攻關(guān)新一代高性能計(jì)算機(jī),向新的“中國速度”發(fā)起沖鋒。
1997年,博士畢業(yè)留校的肖立權(quán)成為國防科技大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)研究所的一名科研人員。從那時(shí)起,他就與巨型機(jī)一起成長。他參與了“銀河”“天河”高性能計(jì)算機(jī)多代機(jī)型的研制,從一名普通的科研人員一步步成長為國防科技大學(xué)超級計(jì)算機(jī)團(tuán)隊(duì)的核心骨干。
“走別人沒有走過的路很難,但我喜歡挑戰(zhàn)!”這是肖立權(quán)常說的一句話。20世紀(jì)末,大規(guī)模計(jì)算機(jī)系統(tǒng)中通常采用電互聯(lián)技術(shù),傳輸速率低且易受干擾,影響系統(tǒng)穩(wěn)定性。這是我國研制千萬億次級超級計(jì)算機(jī)路上的一塊絆腳石。
如何搬開這塊絆腳石?用光互聯(lián)替代電互聯(lián)是最優(yōu)解決方案,研究所將這一重任交給了肖立權(quán)。這條別人沒有走過的路,注定充滿坎坷。
2003年,肖立權(quán)受領(lǐng)任務(wù)后,立即著手解決這項(xiàng)技術(shù)難題。然而,按照他的思路做出來的系統(tǒng)根本跑不起來。
“是哪里出了問題?”那個(gè)夏天,肖立權(quán)滿腦子都在問為什么,午休時(shí)閉上眼睛,腦海中也都是屏幕上滾動的數(shù)據(jù)。“沒法睡!去實(shí)驗(yàn)室!”
肖立權(quán)架起示波器、邏輯分析儀,全神貫注觀察著,生怕錯(cuò)過關(guān)鍵數(shù)據(jù)。
解決思路一次次提出,但又一次次推翻。有一天,肖立權(quán)突然冒出一個(gè)想法:是不是數(shù)據(jù)傳輸有問題?靈光突現(xiàn),他一下找到了解決問題的“鑰匙”。由此,我國光互聯(lián)技術(shù)在大規(guī)模計(jì)算機(jī)系統(tǒng)中得到有效驗(yàn)證,這為后續(xù)該技術(shù)在超級計(jì)算機(jī)系統(tǒng)中的應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
此后,肖立權(quán)瞄準(zhǔn)這一技術(shù)領(lǐng)域,啃下了一個(gè)又一個(gè)“硬骨頭”,解決了光互聯(lián)替代電互聯(lián)的系列技術(shù)難題,成功研制出我國首臺采用光互聯(lián)技術(shù)的并行計(jì)算機(jī)互聯(lián)通信系統(tǒng),使傳輸速率從原有的400Mbps一路飆升為10Gbps,實(shí)現(xiàn)數(shù)量級飛躍。
2010年11月,“天河一號”憑借優(yōu)異性能登上世界超算500強(qiáng)榜首,中國超算首次問鼎世界超算桂冠;2013年6月,“天河二號”以峰值運(yùn)算速度每秒5.49億億次,持續(xù)計(jì)算速度每秒3.39億億次,輕松摘得世界超算500強(qiáng)桂冠,我國超級計(jì)算機(jī)研制達(dá)到世界領(lǐng)先水平;2013年11月,“天河二號”蟬聯(lián)世界超算500強(qiáng)榜首……
作為“天河一號”“天河二號”的副總設(shè)計(jì)師,肖立權(quán)瞄準(zhǔn)世界高性能計(jì)算機(jī)技術(shù)前沿,不斷探索創(chuàng)新,取得了豐碩成果。
高速互聯(lián)通信是決定大規(guī)模并行計(jì)算機(jī)系統(tǒng)實(shí)用效率的關(guān)鍵,美國對中國嚴(yán)格封鎖高速互聯(lián)技術(shù)轉(zhuǎn)讓。當(dāng)時(shí),“天河一號”在國內(nèi)首次創(chuàng)新性地采用了CPU+GPU異構(gòu)融合體系架構(gòu),其內(nèi)部數(shù)萬個(gè)CPU和GPU需要通過互聯(lián)通信系統(tǒng)實(shí)現(xiàn)信息交換,難度可想而知。組織并全面負(fù)責(zé)互聯(lián)通信系統(tǒng)自主設(shè)計(jì)研制任務(wù)的肖立權(quán)壓力很大。
闖關(guān)路很艱難,但肖立權(quán)走得很扎實(shí)。寒來暑往,他不僅協(xié)助制定系統(tǒng)的總體技術(shù)方案、技術(shù)路線和設(shè)計(jì)指導(dǎo)原則,還經(jīng)常盯在試驗(yàn)一線,從原理驗(yàn)證到工程實(shí)踐,一個(gè)環(huán)節(jié)都不放過。在他的帶領(lǐng)下,團(tuán)隊(duì)開展關(guān)鍵技術(shù)、核心技術(shù)攻關(guān),成功將“天河一號”送上世界超算第一的寶座。
雖然獲得了國際聲譽(yù),但肖立權(quán)沒有絲毫懈怠,他早已瞄準(zhǔn)了運(yùn)算速度更快的億億次超級計(jì)算機(jī)系統(tǒng)——“天河二號”。在原有基礎(chǔ)上,他帶領(lǐng)團(tuán)隊(duì)進(jìn)行了10個(gè)月的“封閉攻關(guān)”,“天河二號”高速互聯(lián)通信系統(tǒng)性能得到提升,是當(dāng)時(shí)國際商用互聯(lián)系統(tǒng)的兩倍。它可以把上萬顆微處理器聯(lián)系起來,共同解決同一個(gè)計(jì)算問題,解決了高效互聯(lián)中“微處理器越多效能越低”的世界難題。
在這條自主創(chuàng)新的道路上,肖立權(quán)帶領(lǐng)項(xiàng)目組進(jìn)行了長達(dá)1年的封閉設(shè)計(jì)工作,自主研制出互聯(lián)通信系統(tǒng)最核心的兩塊芯片:路由器和網(wǎng)絡(luò)接口。
一臺超級計(jì)算機(jī)系統(tǒng)好比一個(gè)大城市,互聯(lián)通信系統(tǒng)就是城市的公路網(wǎng),路由器就是立交橋,網(wǎng)絡(luò)接口就是主干道出入口。一個(gè)城市公路網(wǎng)市政設(shè)施建設(shè)得再好,立交橋和主干道出入口不設(shè)計(jì)好,城市交通依然擁擠不堪。
依靠自主創(chuàng)新,肖立權(quán)帶領(lǐng)團(tuán)隊(duì)掌握了屬于自己的核心關(guān)鍵技術(shù)。這是“天河二號”在發(fā)展迅猛、競爭激烈的世界超算領(lǐng)域長時(shí)間保持領(lǐng)先地位的主要原因,一如TOP500主要撰稿人杰克·唐加拉所說:“中國自主研發(fā)了內(nèi)部互聯(lián)技術(shù),這是買不來的,這是他們基于芯片、路由器及自主生產(chǎn)的交換器開發(fā)出來的。”
“我們參加世界排名并不僅僅是為了得第一。世界超算500強(qiáng)榜單其實(shí)是一個(gè)交流平臺,只有在國際上有了聲譽(yù),別人才愿意和我們交流。”肖立權(quán)深知,只有自立自強(qiáng),掌握自主核心關(guān)鍵技術(shù),才能在國際上掌握發(fā)言權(quán),讓世界聽到來自中國的聲音,讓中國更好地了解國際前沿發(fā)展趨勢。
今年夏天,肖立權(quán)沒有放松,他正帶領(lǐng)團(tuán)隊(duì)全力投入新一代高性能計(jì)算機(jī)的研制攻關(guān),他的目標(biāo)是,摘取“超級計(jì)算機(jī)的下一頂皇冠”。
轉(zhuǎn)自:環(huán)球網(wǎng)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65367254。
延伸閱讀
版權(quán)所有:中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號-2京公網(wǎng)安備11010502035964