賽靈思FPGA：如何讓AI變現能力迅速增強？

人工智能賽靈思技術移動互聯網 GPU 中央處理器智能手機電腦人臉識別無人駕駛 Google 機器人 Siri 創業設計高工機器人網 2019-04-18

【文/潘敏瑤】在過去的20多年技術發展過程中，我們經歷了PC時代、互聯網時代、移動互聯網時代、AI時代，以及所面臨的下一個時代——AI+IoT。

在PC時代，基本上每個人或者每個家庭都開始有了電腦，有了互聯網之後，人與人或者機器與機器之間的連接慢慢賦予能力。在過去十幾年裡，隨著手機的普及，尤其智能手機的普及，第一次智能終端的數量超過全球人口的數量，每個人都有一個手機作為智能終端；現在，人人都在討論AI，考慮AI怎麼落地，大家也在思考未來10年、15年、20年的AI+IoT時代是什麼樣子。

賽靈思人工智能市場總監劉競秀分析：“AI並不是某一個行業或者某一個產品，最終還是要落地在具體的場景、行業、需求上。AI最終會被所有需要做計算、做理解、做感知的設備、場景和服務提供本地的計算能力和雲上的計算能力，本質上AI是通用能力，就像電、內燃機一樣，它所賦能的並不是某一個特定行業狹窄的應用，而是可以促進眾多行業的產業升級、產品迭代。但不同行業對AI的需求以及AI能做什麼，不同的廠商、不同的客戶會有不同的理解。”

在他看來，AI的核心是高性能計算，通常講到計算就會想到CPU和GPU。CPU用於通用計算，GPU用於高性能計算。“從2012年開始，第三波人工智能起來，到現在人工智能發展迅速，但落地的場景和我們看到的回報還是低於大家的預期。”

人工智能落地的兩個“剪刀差”

劉競秀認為，有兩個剪刀差阻礙了這個時間點人工智能的落地。第一個是需要處理的數據和計算芯片所能夠提供的處理能力之間的剪刀差。

計算芯片工藝從過去28納米、20納米、 16納米、14納米進一步發展到10納米、7納米、5納米、3納米，摩爾定律使芯片性能增速越來越飽和。“大家看到技術的趨勢，只有高端的消費類、迭代很快的產品，例如手機，才能支撐得起最先進工藝高昂的芯片迭代成本。”

至於芯片的發展趨勢，無論從CPU、GPU到FPGA、ASIC，對於通用芯片來講，它的好處是應用比較廣泛、上手比較快，大公司如谷歌、阿里也在推出芯片，眾多創業公司都在做各種各樣的ASIC，希望在特定的定製領域提供一些場景和應用。

對這些特定的場景和應用，ASIC的性價比可能更高，所以技術發展的趨勢一定是從CPU、GPU到FPGA，最後到ASIC。“所以在市場上有一個很重要的時間窗口，就是每個行業在需求成熟之前，在大家有能力、有信心去開ASIC把這個錢賺回來之前，大家不會去開ASIC，而且這時候又需要一個平臺做初期的市場嘗試或者在激烈的市場競爭中快速將創意變成現實，贏得市場先機，這時候FPGA就是最好的計算平臺產品。” 劉競秀表示。

第二個剪刀差就是芯片設計生產的長週期和快速迭代的市場需求之間的差距。劉競秀指出：“芯片不是靠錢就可以換時間的技術，最快也要一年半到兩年才有可能走完一個完整的流程，從後端設計包括封測等等，這個一年到兩年的時間窗口是任何人做ASIC都要經歷的。”

目前許多AI公司的客戶，很多情況下需求都非常緊迫，如這個月有一個項目，希望供應商下一個月就能出方案和產品。所以，第二個剪刀差就是快速變化、快速迭代的市場和ASIC開發週期漫長之間的差距。

商業模式發展趨勢的兩大關鍵因素

過去這幾年，各種各樣AI相關的主流應用場景，包括視頻和圖像相關應用，基於語音相關的應用。

首先，中國安防監控系統在逐步增強，後來發現佈置的攝像頭越多就需要越多的人來看，導致警察大量的時間花在看視頻上從而導致警力的不足，而AI恰好可以在這一個痛點上極大的提高警察系統的效率。“AI不需要準確地告訴你誰是壞人，只要告訴你今天有十個嫌疑人是壞人，只要看這十個人就好了。”

除了行業應用的安防監控，現在的高檔寫字樓、高檔酒店，跟人臉識別相關的場景也越來越多，包括機場、火車站設置了大量無人值守的閘機。

第二類應用是隨著最近幾年有大量短視頻的網站興起，對於這樣的公司，他們有個很重要的剛需，就是內容審查機制。“現在都是靠大量的人力來做，這是很有限的，而AI視頻審查在可以緩解這方面的壓力。非實時短視頻業務相對比較容易做，但直播類的比較難。因此，大量的AI公司會基於文字、人臉識別、行為動作，提出審查機制的解決方案，促成不同場景、不同網絡節點都在做相應的嘗試和大量的部署。”

第三類應用與消費類相關，如無人值守超市。此外，還有與汽車相關的應用，如自動駕駛、無人駕駛，這些ECU(電子控制單元)最終都需要它具備一定的理解能力，輔助中央控制器做相應的判斷和決策。

跟語音相關的應用就非常豐富了，如家裡的聊天機器人、小度，包括手機裡的siri，都是用AI做輔助的應用，但語音相關的應用本質上來說和視覺相關應用相比還不足夠成熟，其關鍵因素是，視覺相關的應用，用CNA或者DNN做網絡檢測的應用，能夠提供端到端解決方案的技術，對於語音應用，AI(例如LSTM)在語音應用裡面，這樣的網絡模型只是不同語音模型中的一部分，有大量的前處理跟後處理的技術，跟AI沒有關係。此外，可以發現語音聊天機器人能力有限，無論數字級多豐富，訓練的網絡多深，也沒辦法聊上二十句。

賽靈思方案：靈活應變萬物互聯的高性能計算平臺

從賽靈思的角度來看，無論是萬物互聯還是大規模的超算，都是為給客戶和市場提供快速部署的平臺，目標是提供靈活應變萬物互聯的高性能計算平臺。

秉持“數據中心優先，加速核心市場發展，驅動自適應的計算”的戰略，賽靈思聚焦於汽車、通信領域、航空航天，傳統工業控制、醫療等領域。

賽靈思下一代的Versal計算引擎，首先面對通信和人工智能高性能場景，定義了完全不一樣的芯片價格，利用3D技術提供高性能的高帶寬存儲，提供計算和存儲能力。

“人工智能的網絡都是幾十、幾百層，幾千萬、上億參數的快速運算和反覆的讀取，如果每一層的數據運算的結果都需要去讀寫的話，就會導致延時長、功耗大，所以目前主流做AI芯片的企業慢慢會提供儘可能大的存儲空間，而3D的技術是最有效提供高性能面向存儲的技術。同時，充分利用硬核處理器功能，支持AI場景的快速運算。”

從人工智能的解決方案來看，我們希望為客戶提供端到端的解決方案，為客戶提供不同層次的支持，從底層的硬件，中間各種各樣的IP以及軟件，應用層各種各樣的神經網絡模型，都可以提供給客戶。

從行業的角度來看，賽靈思希望提供的是一個通用的AI解決方案，首先，在底層定義了自己的指令級和IP，這些高效的定製IP專門為人工智能做不同的算子，比如特殊編程，提供定向加速的IP，定向到相應的指令。此外，開發了工具，通過這些工具和SDK為客戶提供了接口，客戶調用的方案後，就可以支持不同行業不同場景的應用。

事實上，無論是人臉、車輛等都是不同的CNA，它們核心的算子都是一樣的，就是網絡架構和參數配置不一樣，然後生成不同的指令，最終運行在不同的硬件平臺上。

“FPGA很多場景應用非常高，代價是週期比較長，三個月、六個月到一年都可能，使用賽靈思現有的方案，最快幾個小時就可以把新的網絡部署在硬件上，把系統運行起來，這對人工智能的創業公司和合作夥伴來講是最重要的，可以非常快地拿到一個原型機，用這些原型機去真正的場景做性能、功能的迭代、數據的收集，這樣產品才能更快推向市場。”

賽靈思作為一家傳統的FPGA芯片公司，現在已經慢慢走向另外一個維度，希望為客戶提供的不單是一顆芯片，以及圍繞芯片的PCB層面的參考設計，現在更希望的是幫客戶提供基於芯片、IP加上工具，以及客戶在真實場景中真實應用的算法，全套幫助客戶提供參考設計，並免費提供給客戶參考設計的神經網絡，從而幫助客戶更好的使用基於賽靈思FPGA的解決方案。

賽靈思FPGA：如何讓AI變現能力迅速增強？

相關推薦