李國傑院士:超算正與智能“歷史性會合”——“智能計算機”的歷史、現在和未來

【編者按】6月27—29日,2019年世界智能計算機大會在深圳舉行。在這次大會上,中國工程院院士、中科院計算所首席科學家、中科曙光董事長李國傑以《對智能超級計算機的幾點認識》為題,深入淺出地剖析了智能計算機的歷史、現在和未來。

李國傑院士:超算正與智能“歷史性會合”——“智能計算機”的歷史、現在和未來

歷史:超算是超算,智能是智能

“計算機之父”馮·諾依曼曾經試圖模仿神經網絡設計計算機,但並未成功。1946年11月,馮·諾依曼在給“控制論之父”諾伯特·維納的信中寫道:“我們選擇了太陽底下最複雜的一個對象……向世人展示了一種絕對的且無望的通用性。”

事實上,從第一臺電子計算機開始,計算機的發展就與模擬神經網絡分道揚鑣。此後數字計算的飛速發展,使得用計算機實現人工智能的方式與人腦的思維機制幾乎不沾邊。

20世紀80年代末至90年代初,在日本第五代計算機項目帶動下,全球掀起一陣“智能計算機熱”。當時的熱點是面向智能語言和知識處理的計算機,研究重點是並行邏輯推理。

日本五代機走的是“定製化路線”。我國“智能計算機”研製走的則是一條比較通用的路線:從芯片、系統到軟件、應用,都是“非定製化”。

1990年,國家科委(科技部的前身)批准成立“國家智能計算機研究開發中心”,不但開展了曙光系列並行計算機的研製,還從事了人工智能的基礎研究和應用研究,為今天智能超算的發展打下了基礎。

錢學森先生曾發表《關於“第五代計算機”的問題》提議:“第五代計算機是什麼?是第二代巨型計算機。我認為再把這個概念叫做五代計算機或者六代計算機,就不那麼合適了……建議為了不要混淆起見,就乾脆叫第一代智能機。”

以此為標誌,所謂的第五代計算機就分成了兩個叉:一個是第二代巨型計算機,一個是第一代智能機——這是兩個不同的概念。

事實證明,歷史的發展與錢老的預測是相符的,從20世紀80年代以後的30年,計算機的發展之路確實符合錢學森的預測,超算是超算,智能是智能。

現在:智能與超算的歷史性會合

超級計算是“算得快”的計算機。但智能計算機和超算不一樣:智能的本意是“算得巧”,而不是“算得快”。這是兩股道上的車。

本世紀以來,深度神經網絡的成功和大數據的興起,使得超級計算和計算智能(深度學習)走到一起,出現“歷史性的會合”。

過去高性能計算機主要用於科學計算,現在的高性能計算機已大量用於大數據和機器學習。一組數據可以說明這一點:2015年,中國HPC在數據分析與機器學習領域應用只有27%,至2016年達到48%、2017年提升到56%。預計這個比例今後還將繼續提高。

但是也應該看到,目前大量採用的智能計算實際上是基於GPU或GPU-Like加速器的“準智能計算”。比如,圖像和語音的信號處理計算還是數值計算。

智能算法可以加速傳統的科學計算。舉例來說,今年4月,200多名科研人員從四大洲8個觀測點“捕獲”了黑洞的視覺證據。此項研究歷時10餘年,加州理工學院曾經採用Blue Waters超級計算機進行近900個黑洞合併的模擬,花費了2萬小時的計算時間。後來採用新的機器學習程序和算法,從模擬中學習,幫助創建新的模型,在毫秒內就能給出合併結束狀態的答案,大大促進了關於黑洞的研究。

如今,機器學習不僅是人工智能領域研究的重點,也正成為整個計算機科學研究的熱點。

未來:智能超算的十大關注方向

人類可能會發明新的智能計算機,但至少最近20年內,智能超算是要高度重視的研究方向。關於智能超算的未來研究方向,以下10個方面值得重視。

第一,未來十年是體系結構的黃金時期。近幾十年計算機的飛速發展一半來自摩爾定律,另一半來自系統結構的改進。摩爾定律即將走到盡頭,計算機未來的改進將主要從結構改進入手。圖靈獎得主、計算機體系結構宗師David Patterson與John Hennessy預言:“下一個十年將出現一個全新計算機架構的‘寒武紀’大爆發。”

第二,“人腦級能效”將是未來智能計算機的核心特徵。大腦以超低功耗實現了超級複雜的計算,從目前的發展來看,超級計算機現在的能效還滿足不了需求。“超算能效增長遠遠低於速度增長”,是計算機發展70年未有之大變局。這給我們提出挑戰,未來超級計算機要達到像人腦一樣的能效層次。

第三,要研究具有“低熵”特徵的未來架構。智能計算機的本事主要體現在對付“不確定性”,而“熵”就是對不確定性的刻畫。要通過全棧的系統設計應對不確定性挑戰,在問題不確定、環境不確定、負載強度不確定的情況下,保障可預期的性能結果。

第四,要重視研究領域專用系統結構(DSA)以及可重塑處理器。近幾十年通用處理器一直勝過專用處理器,這一局面正在改變。未來大多數計算將在專用加速器上完成,而通用處理器只是配角。

第五,要重視智能超算的通用性。儘管專用化是趨勢,但作為一個智能中心和超算中心,還是要本著為大眾服務的目標儘量匹配更多用戶的需求。

第六,模擬計算值得重視。傳感器接收的都是模擬信息,人腦處理的也是模擬量,連續變量的模擬計算是非圖靈計算。模擬計算是離散數字計算的前輩,經過60年的變遷,模擬計算可能有機會東山再起,連續變量與離散變量的混合計算將開啟計算新天地。

第七,計算存儲一體化。人類的大腦計算和存儲不是分開的,不需要數據搬移,所以未來的計算機體系結構可能要改變傳統的把計算和存儲分開的馮·諾依曼結構。

第八,推理驅動與數據驅動可能會交替發展。目前的智能應用,主要是數據驅動。人工神經網絡屬於開普勒研究模式,而人工智能研究中的推理驅動則是繼承牛頓的演繹推理模式。1956年的“達特茅斯會議”預設了實現人工智能要走牛頓模式:先精確描述智能。但數據驅動如何轉到推理驅動需要認真探索。

第九,要重視事件驅動計算。未來人工神經網絡應考慮“時間”因素,基於事件的信息流(事件驅動計算)可直接反映人腦工作的自然模式,這是一種新的“空間—時間模式”。

第十,要建立智能超算新的測試基準。長期以來,評測超級計算機的性能都採用Linpack測試程序。它可以測出幾乎滿負荷、滿功耗下的計算機浮點計算性能,是測試超級計算機可靠性和穩定性的理想程序。但是,由於功耗的限制,當前發展通用超級計算機已遇到極大的困難,領域專用超級計算機成為熱門研究方向,Linpack顯然不適合作為領域專用計算機的測試標準。

建立統一的基準評價標準,有助於行業內的良性競爭。希望從過去的超算到大數據和人工智能有一套新的標準,有一把尺子衡量技術,將影響力從學術界延伸至產業界。

來源:中國科學報

相關推薦

推薦中...