科學家王海峰:從百度十篇論文入選ACL 2019說起

中新網5月29日電 近日,國際自然語言處理(NLP)領域的權威學術會議“國際計算語言學協會年會”(ACL 2019)公佈了今年大會論文錄用結果,其中,百度共有10篇論文被收錄。對於國內企業來說,這可謂一次前所未有的突破。

科學家王海峰:從百度十篇論文入選ACL 2019說起

在國際自然語言處理領域,百度一直處於第一梯隊。自然語言處理技術不僅在諸如搜索、地圖、輸入法、翻譯、小度助手等自家產品中被廣泛應用,相關研究論文此前也在各類國際AI頂會中頻頻露臉,代表中文NLP研究“秀實力”。因此,ACL 2019的這個錄取結果,對於百度而言,就如同學霸考試又拿了高分一樣,並不意外。

只是,提到ACL,不由讓人想到百度高級副總裁、AI技術平臺體系(AIG)和基礎技術體系(TG)總負責人王海峰——他本人也曾於2013年出任ACL主席,是ACL歷史上的首位華人主席。去年7月,ACL宣佈成立亞太分會AACL,他又擔任了創始主席。這兩次出任國際頂級學術會議主席,在當時都被認為是中國AI領域的大事件。

在國家大力推動科技創新發展、人工智能技術快速推進、應用成果遍地開花的當下,王海峰和他的團隊無疑已是中國乃至國際AI界的一張寶貴“名片“。而究其背後,我們不難看到王海峰兼具科學家、技術實踐者、AI佈道師三重身份,在人工智能行業發展的道路上映射出的那道亮光。

第一重身份:科學家

百度百科中對於“科學家“有一段描述:對真實自然及未知生命、環境、現象及其相關現象統一性的客觀數字化重現與認識、探索、實踐的人。簡而言之,“科學家“三個字意味著“探索未知”。王海峰就是一位在人工智能領域探索前行且成果豐碩的科學家。

他的創新研究成果,最早可以追溯到在哈爾濱工業大學讀書期間。碩士時,他主導開發的漢英機器翻譯系統,獲得了國家“863”評測第一名及部級科技進步獎。而1999年的博士論文中,他已經開創性地探索了神經網絡機器翻譯的可能性。

而走出校園以後,王海峰依然堅持科學研究。截至目前,他已經在國內外知名會議或期刊發表學術論文120餘篇,已授權或公開的發明專利200餘項,主持國家級重大科研項目3項,並獲得國家科技進步二等獎一項、中國電子學會科技進步一等獎四項,均為第一獲獎人。

關於收穫這些成果的經驗,他總結為“堅持走在正確的道路上“。2018年,他獲得了中國人工智能領域的最高榮譽——吳文俊人工智能傑出貢獻獎。彼時,在談及自己近30年的科學研究之路時,王海峰總結說,這期間有停滯不前的沮喪,有曲高和寡的無奈,但更多的是研究成果為大眾所用的喜悅,以及隨之而來的認可。

而這種認可,也體現在他在國際學界的地位上。2013年,他成為了全球影響力最大、最具活力的國際學術組織之一ACL歷史上首任華人主席。2018年,當ACL宣佈成立亞太區域分會AACL時,他又順理成章地成為AACL首任主席。此外,他還在IEEE工業顧問委員會委員等權威學術組織、會議擔任職務。

學術成就帶來的外界認可,以及在權威組織擔任職務的履歷,也成就了王海峰的另一個特質:人才吸引力。如同一句老話所說:“物以類聚,人以群分。”他所帶領得百度研究院,匯聚了眾多海內外頂級科學家。僅在2018年,就引入了十幾位人工智能領域的資深科學家。這些專家,都在學術圈聞名遐邇,有的本在國際頂尖高校任職,卻最終都被百度和王海峰所吸引,加入了這支強大的團隊。他們的研究領域覆蓋信息挖掘、計算機視覺、語音技術、機器人、大數據挖掘、商業智能等,幾乎囊括了AI領域從底層基礎到認知、感知技術的全領域範疇,多次取得對學界和工業界都具備重要意義的突破性成果。

比如在NLP領域,本次ACL 2019錄取的10篇論文,就覆蓋了信息抽取、機器閱讀理解、對話系統、視頻語義理解、機器翻譯等諸多NLP領域的熱點和前沿研究方向,提出了包括基於注意力正則化的ARNOR框架、語言表示與知識表示深度融合的KT-NET模型、多粒度跨模態注意力機制、基於端到端深度強化學習的共指解析方法等,在人機交互、智能客服、視頻理解、機器翻譯等場景中具有很大的應用價值。帶領團隊取得成就,王海峰的科學家身份也又了多一層的含義。

第二重身份:AI技術的實踐者

“AI的發展最終是要‘服務人’。 “秉持這一觀點的王海峰,沒有把科學研究的成果僅僅存放在實驗室中,讓眾人膜拜,卻又高不可攀,而是積極地推動AI技術走出實驗室、走向實踐,服務於人。

簡單舉幾個例子就足以說明這一點。在機器翻譯領域,王海峰深耕近30年,2010年加入百度後,他帶領團隊融合統計與規則、實例和神經網絡等方法,實現了多方面的技術創新,並在2015年率先發布互聯網神經網絡翻譯系統。目前,百度翻譯可支持全球28種語言互譯,覆蓋756個翻譯方向,超過15萬家第三方應用接入百度翻譯API,每日翻譯字符數超過千億,免費服務全球數億用戶;他和他的團隊,在百度地圖中採用基於深度學習技術進行時間預估,可準確預測從出發地到目的地真正需要花費的路線和時間,每天為用戶提供約5億次時間預估服務,我們每天使用百度地圖規劃自己的出行路線,背後就是深他們的功勞。

“技術不是說要做到 100% 準確才能用,效果達到一定程度,就好用了。”作為實踐AI、用AI服務於人的先行者,王海峰帶領團隊,開創了一條讓AI在應用中進化的道路。在技術研究和產業發展兩條線的軌跡中,他找到了交叉點。他帶領團隊搭建起了完備的AI技術架構,推動百度AI技術多年積累和業務實踐集大成——百度大腦,在取得一個又一個的突破性成果的同時,也在不斷對外釋放勢能。目前,百度大腦已經對外開放了170多項領先的AI能力,並有超過110萬開放者匯聚於此,通過他們,這些AI能力也逐漸深入到工業、農業、醫療、零售、金融等各個領域,為當下中國的產業智能化注入能量。

第三重身份:AI現實和遠景的佈道師

如果說,科學家和實踐家這兩種不同身份,已經在王海峰的身上已經實現了融合了的話,那“佈道師”三個字幾乎也是順理成章。如何正確的看待AI? AI如何影響我們的生活的?AI的未來是什麼?在AI這種新的生產力改變時代的同時,讓社會、讓人們具備“AI素養”至關重要。

“全社會和我們每一個人對於AI抱有正確的認識和預期,不能過高,也不能畏懼,才能更好地擁抱AI。我們一起努力,用AI技術讓我們的未來變得更加美好。”王海峰是這麼說的,也是這麼做的。

2018年的百度AI開發者大會上,他用RAP的方式給百度地圖下了一道指令:“我要從三里屯的團結湖地鐵站出發路過望京的家樂福然後再去南鑼鼓巷最後到我家,我要紅綠燈少的不堵車的最快的路線,你幫我路線規劃一下吧。”百度地圖語音助手精準識別、理解了這段長達60多字的服務請求,並自然流暢地提供了導航服務,引起現場觀眾驚呼。原本晦澀的技術,也因為這種生動詼諧的展示方式而被理解和接受。而他的這段“科學家的神級Rap‘調戲‘”也成為口口相傳的經典橋段。

面對人工智能行業的火熱,有關“行業泡沫”的質疑聲不絕於耳。他說:“人工智能這杯酒,雖然有泡沫,但撇去泡沫之後,仍是醇香的美酒。”一個形象的比喻,足以讓真正願在行業中踏實進取的人安心。

在不久前剛剛舉行的首屆深度學習開發者峰會上,王海峰對深度學習的未來發展做出了論斷:“深度學習正在推動人工智能進入工業大生產階段。深度學習框架是智能時代的操作系統。”看似簡單的兩句話,背後是他近三十年深耕實踐和對人工智能未來發展深度思考的凝練。

實際上,早在2012 年前後,在很多人還不知道深度學習為何物時,他就已經意識到其價值,並帶領團隊開始將深度學習技術應用逐步應用到百度的語音識別、圖像識別、搜索等產品中,成為中國產業界深度學習的嚐鮮者和開路人。

成功實踐後,他又開始為我國自主研發的深度學習框架奔走呼號。2018年4月首屆數字中國建設峰會上,面對當時市場上對於自主芯片技術的熱烈討論,他即指出:“芯片領域的下一步發展,會越來越多和人工智能技術結合,基於人工智能技術轉化應用。這就要用到深度學習框架,所以,百度PaddlePaddle等深度學習框架一定意義上相當於人工智能芯片的指令集。”同時,他也進一步呼籲:“我們正處在人工智能芯片開始發展的時期,這是一個難得的歷史機遇。我們要抓住機遇,做出領先的深度學習技術和人工智能芯片,繼續推動人工智能算法、芯片、行業標準、人才培養、應用落地等產業層面的發展,保障產業和數據安全。在當下中國的語境中,核心科技自主創新已被提高到前所未有的高度,現在回看他那時發出的聲音,振聾發聵。

相關推薦

推薦中...