為什麼吳恩達認為未來屬於遷移學習？

機器學習吳恩達人工智能 Google 雷鋒網 2017-04-19

雷鋒網按：日前，知名 AI 博主、愛爾蘭國立大學 NLP 博士生 Sebastian Ruder 以“遷移學習：機器學習的下一個前線”為題，對遷移學習的技術原理、重要性與意義、應用方法做了詳細闡述。本文對其中討論遷移學習的原理、重要性，以及吳恩達的預測的部分做了節選，閱讀原文（英文）請戳這裡。雷鋒網編譯。

Sebastian Ruder

Sebastian Ruder：在訓練深度神經網絡、學習輸入到輸出的精準映射上，近年來我們做得越來越好。不管是針對圖像、語句，還是標籤預測，有了大量做過標記的樣例，都已不再是難題。

今天的深度學習算法仍然欠缺的，是在新情況（不同於訓練集的情況）上的泛化能力。

在什麼時候，這項能力是必須的呢？——當你把模型應用於現實情形，而非小心翼翼整理好的數據集的時候。現實世界是相當混亂的，包含無數的特殊情形，會有許多在訓練階段模型沒有遇到過的情況。因而未必適於對新情況做預測。

把別處學得的知識，遷移到新場景的能力，就是遷移學習。

遷移學習的原理

在機器學習的傳統監督學習情況下，如果我們準備為某個任務/領域 A 來訓練模型，獲取任務/領域 A 裡標記過的數據，會是前提。圖 1 把這表現的很清楚：model A 的訓練、測試數據的任務/領域是一致的。

圖 1: 傳統的 ML 監督學習

可以預期，我們在該數據集上訓練的模型 A，在相同任務/領域的新數據上也能有良好表現。另一方面，對於給定任務/領域 B，我們需要這個領域的標記數據，來訓練模型 B，然後才能在該任務/領域取得不錯的效果。

但傳統的監督學習方法也會失靈——在缺乏某任務/領域標記數據的情況下，它往往無法得出一個可靠的模型。舉個例子，如果我們想要訓練出一個模型，對夜間的行人圖像進行監測，我們可以應用一個相近領域的訓練模型——白天的行人監測。理論上這是可行的。但實際上，模型的表現效果經常會大幅惡化，甚至崩潰。這很容易理解，模型從白天訓練數據獲取了一些偏差，不知道怎麼泛化到新場景。

如果我們想要執行全新的任務，比如監測自行車騎手，重複使用原先的模型是行不通的。這裡有一個很關鍵的原因：不同任務的數據標籤不同。但有了遷移學習，我們能夠在一定程度上解決這個問題，並充分利用相近任務/領域的現有數據。遷移學習試圖把處理源任務獲取的知識，應用於新的目標難題，見圖 2。

圖 2: 遷移學習

實踐中，我們會試圖把源場景儘可能多的知識，遷移到目標任務或者場景。這裡的知識可以有許多種表現形式，而這取決於數據：它可以是關於物體的組成部分，以更輕易地找出反常物體；它也可以是人們表達意見的普通詞語。

為什麼遷移學習這麼重要？

在去年的 NIPS 2016 講座上，吳恩達表示：“在監督學習之後，遷移學習將引領下一波機器學習技術商業化浪潮。”

雷鋒網獲知，當時，吳恩達在白板上畫了一副草圖，對他的立場進行解釋。Sebastian Ruder 將其用電腦繪製了出來，便是下圖：

該圖是吳恩達眼中，推動機器學習取得商業化成績的主要驅動技術。從中可以看出，吳老師認為下一步將是遷移學習的商業應用大爆發。

有一點是毋庸置疑的：迄今為止，機器學習在業界的應用和成功，主要由監督學習推動。而這又是建立在深度學習的進步、更強大的計算設施、做了標記的大型數據集的基礎上。近年來，這一波公眾對人工智能技術的關注、投資收購浪潮、機器學習在日常生活中的商業應用，主要是由監督學習來引領。如果我們忽略“AI 冬天”的說法，相信吳恩達的預測，機器學習的這一波商業化浪潮應該會繼續。

另外一點卻不是那麼清楚：為什麼遷移學習已經存在數十年了，但卻在業界沒什麼人用？更進一步，吳恩達預測的遷移學習商業應用爆發式增長，究竟是否會發生？

相比無監督學習和強化學系，遷移學習目前的曝光程度不高，但越來越多的人正把目光投向它。

對於前兩者，比如說被認為是“通用 AI”（General AI）關鍵的無監督學習，其重要性隨著 Yann LeCun 的佈道以及“蛋糕論”越來越受到認可，激起又一波關注。生成對抗網絡在其中扮演技術先鋒角色。對於強化學習，最顯著的推動力量是谷歌 DeepMind。沒錯，我指的是 AlphaGo。強化學習技術已經在現實場景取得成功應用，比如降低了 40% 的谷歌數據中心溫控成本。

Yann LeCun 蛋糕論。在他看來，強化學習是櫻桃，監督學習是糖衣，無監督學習才是糕體。但耐人尋味的是，其中並沒有遷移學習。

這兩個領域都前景光明。但是，在可預期的將來，它們恐怕只會產出相對有限的商業化成果——更多是學術成果，存在於尖端研究和論文中。這是因為這兩個領域面臨的技術挑戰仍然非常嚴峻。

遷移學習的特別之處在哪？

當前，業界對機器學習的應用呈現二元化：

一方面，近年來我們獲得了訓練更多、更精確模型的能力。現在所處的是一個全新階段：對於許多任務，最先進的模型的性能，已達到了一個此前夢寐以求的水平：如果把這些模型不計代價地推向市場，消費者將不會抱怨其核心能力。
尖端模型的性能已強到什麼程度呢？
最新的殘差網絡（residual networks）已經能在 ImageNet 上取得超人類的水平；谷歌 Smart Reply 能自動處理 10% 的手機回覆；語音識別錯誤率一直在降低，精確率已超過打字員；機器對皮膚癌的識別率以達到皮膚科醫生的水平；谷歌 NMT 系統已經應用於谷歌翻譯的產品端；百度 DeepVoice 已實現實時語音生成……
這個列表可以搞得很長。我要表達的意思是：這個水平的成熟度，已經讓面向數百萬用戶的大規模模型部署變得可能。
但在另一方面，這些成功的模型對數據極度飢渴，需要海量標記數據來達到這樣的效果。在某些任務領域，這樣的數據資源是存在的——背後是多年的艱辛數據收集。而在個別情況下，數據是公共的，比如 ImageNet。但是大量的標記數據一般是專有的、有知識產權，亦或是收集起來極度昂貴，比如醫療、語音、MT 數據集。
同時，當機器學習模型被應用於現實情形，它會遇到無數的、此前未遭遇過的情況；也不知道該如何應付。每個客戶、用戶都有他們的偏好，會產生異於訓練集的數據。模型需要處理許多與此前訓練的任務目標相近、但不完全一樣的任務。當今的尖端模型雖然在訓練過的任務上有相當於人類或超人類的能力，但在這些情況下，性能會大打折扣甚至完全崩潰。

遷移學習是對付這些特殊情況的殺手鐗。許多產品級的機器學習應用，需要進入標記數據稀缺的任務領域，對於這類商業應用，遷移學習無疑是必需的。今天，數據的“低樹果實”基本已經被摘光，接下來，必須要把學得的東西遷移到新的任務與領域中。

相關推薦

'華為未來5年如何能讓全球5億人受益，而不讓一個人掉隊？'

"一年一度的華為全連接大會今日舉行，每一年都舉世矚目，今年更是充滿懸疑。在複雜的國際環境下，全球超過3萬聽眾懷著不同的心情來到上海，傾聽了華為副董事長鬍厚崑的演講：華為今天的狀態非常不錯，就像上海的天氣一樣，秋高氣爽，風輕雲淡，謝謝過去一段時間大家支持，給我淡定前行的動力，...

華為公司技術 ARM 任正非 X86 智能手機我的第一部5G手機人工智能蘋果公司雲計算中央處理器軟件電腦通信餘承東投資數據庫上海不完美媽媽非洲 2019-09-18

'新疆，為什麼造了這麼多鐵路？地球知識局'

"(⊙_⊙) 每天一篇全球人文與地理地球知識局——新疆鐵路NO.1172-新疆鐵路作者：杔格製圖：孫綠 / 校稿：貓斯圖 / 編輯：生菜新疆作為我國陸地面積最大的省級行政單位，地廣人稀，擁有十分複雜惡劣的地質、地形、地貌以及氣候條件環境。客觀因素限制下，鐵路建設在這裡始終...

新疆天山吐魯番庫爾勒蘭州地球甘肅烏魯木齊黃河火焰山天祝張掖西藏上海交通孫中山 Google地圖 Google 讓夢發生 2019-09-18

'為什麼說造電動汽車的特斯拉是一家數據公司'

"來源：汽車之心作者：葉方提到特斯拉，大家總會不自覺站成兩個陣營：一方將這家電動車公司捧上天；另一方則唱衰，認為它最終會被對手們幹掉。換句話說，特斯拉要麼一勞永逸改變汽車行業，要麼就會在不久的將來關張。不過，如果我們放下財務、競爭和Elon Musk這個神奇的存在，從理性...

特斯拉汽車電動汽車人工智能伊隆·馬斯克技術無人駕駛大數據算法電腦軟件數據庫機器學習人機交互硬件眾包石油雷達 2019-09-18

'中國為什麼有前途'

"週五，不說股票，我們聊點小粉紅的內容。從建國開始，我們的基本國策一直是韜光養晦，畢竟和西方列強差的太遠，埋頭猛追是全國人民的首要任務。狂追七十年，不小心追到了世界第二，愣是把鷹醬的獨角戲幹成了二人轉，也就難怪這兩年鷹醬對我們的全面敵視。花果山原來有個猴王，結果不知道從哪蹦...

技術能源交通核聚變石油金融煤炭物理政治文化天然氣農業通信人工智能孫悟空 2019-09-18

'為什麼各相機廠商都大力發展無反相機？對焦是一個重要的因素'

"隨著攝影器材技術水平的提升，可換鏡頭相機正在經歷著從單反系統向無反系統的革新進化，而為什麼好好的單反不用，非要轉向無反呢？這正是因為越來越多的智能技術正在應用於新的相機系統，其中對焦技術的進步是一個重要因素。早期的相機，對焦並不是一個簡單的事情。想要實現焦點的清晰成像，要...

單鏡頭反光相機照相機技術攝影電子技術體育人工智能 2019-09-18

'曾經數學只考10分的碼農，為什麼離職做了這款產品'

" 科技有溫度。文 | 張超你知道哪個省份的人最注重個人隱私嗎？你知道目前日常法律諮詢中，什麼類型的諮詢佔比最多嗎？AI法律產品“包小黑”最近發佈了大數據統計，通過對幾十萬諮詢用戶的統計，發現目前安徽省的用戶最注重個人隱私，每萬人的涉隱私糾紛數是1.10件，在所有省份中排...

數學程序員人工智能技術法律算法機器人大數據大學人生第一份工作杭州淘寶網阿里巴巴集團工程師萬物嚐鮮節農村摩托羅拉創業支付寶法制大連理工大學 2019-09-17

'為什麼索尼敢把APS-C畫幅的α6600賣到萬元以上'

"前段時間參加了索尼秋季新品發佈會。會後有一個專訪。在這個專訪中，我和很多媒體老師問了很多問題。整個過程算是這幾年我遇到的比較犀利的。當然，最犀利的問題是我問的。也就是標題中的問題。蜂鳥網—文子林：APS-C畫幅相機這條產品線，索尼是如何細分消費者的？岸政典：相比全畫幅相...

索尼照相機攝影 MILC相機技術人工智能數碼相機設計 2019-09-17

'華為拿什麼破解AI核心難題？'

"C114訊 9月16日早間消息（舒允文）OpenAI近期發佈的研究顯示，僅2012年以來，人們對於算力的需求增長六年就超過30萬倍，平均每年增長10倍，遠遠超過了摩爾定律的發展速度。作為AI的後入局者，面對AI算力需求的爆發式增長，華為大膽地提出要為業界提供“易獲取、用得...

人工智能華為公司技術雲計算英偉達詹姆斯·瓦特 GPU Google 自然語言處理列奧納多·達·芬奇移動互聯網硬件運營商物聯網納米技術英國電腦穿戴設備特斯拉汽車大數據設計算法交通無人駕駛中央處理器我的第一部5G手機 2019-09-17

'重慶為什麼叫重慶？'

"江北嘴全景圖/張坤琨你好，我是重慶。我是中國歷史文化名城，自古是兵家必爭之地、商賈爭佔之埠。現在，是中國西部唯一直轄市，正致力於推動高質量發展，創造高品質生活，打造“山清水秀美麗之地”。歷史上的我——我為什麼叫“重慶”？那可是有故事的。1189年，趙惇在此先封恭王，旋即...

重慶宋光宗抗日戰爭我在宮裡做廚師家住長江邊農村大數據重慶穿越之旅醫療保險蒙古交通經濟第二次世界大戰文化嘉陵江學前教育養老保險人工智能秦朝紅巖中國歷史騰訊物聯網 SK海力士 2019-09-16

'《從0到1》讀書筆記1：為什麼你覺得生意越來越難做？'

"各位朋友大家好，今天我們給大家帶來一本新書《從0到1》，互聯網人視為至寶，彷彿找到了前路的明燈一般，只要一有論壇，演講必提這本書，這本書的作者是大名鼎鼎的彼得蒂爾，也就是美國支付寶PayPal的創始人，跟埃隆馬斯克爭公司的那位，那麼這本書到底說了什麼，對於現在的互聯網經濟...

從0到1 史蒂夫·喬布斯 Google Paypal 音樂人生第一份工作電腦馬雲 iPhone 經濟拉里·佩奇航空 iTunes 亞馬遜微軟支付寶平板電腦搜索引擎 iPod 2019-09-16

'華為手機失去谷歌服務支持後，會有什麼影響？'

"華為已經確認，計劃於本月發佈的Mate 30系列智能手機不會搭載谷歌應用服務，未來的新品手機也可能得不到谷歌授權更新，引發了市場對於華為手機售後維護服務的疑慮。雖然華為發起了接二連三的造勢，而且幾乎每一次造勢都能引得全國網友們熱血沸騰，比如華為公佈鴻蒙操作系統計劃，宣佈方...

Google 華為公司智能手機 Android 華為手機 Google地圖騰訊應用寶操作系統 Google Play YouTube Line 軟件小米科技 OPPO CyanogenMod 華為Mate 步步高vivo iOS Gmail Uber 魅族科技編譯器微軟 Airbnb 2019-09-16

'馬雲卸任，張勇宣佈未來五年目標：消費規模10萬億；華為發佈基於5G和AI解決方案；新iPhone不支持5G 庫克：市場不成熟……'

"戳藍字“CSDN雲計算”關注我們哦！嗨，大家好，重磅君帶來的【雲重磅】特別欄目，如期而至，每週五第一時間為大家帶來重磅新聞。把握技術風向標，瞭解行業應用與實踐，就交給我重磅君吧！重磅先知華為在世界能源大會上發佈基於5G和AI的系列解決方案阿里巴巴新任董事局主席張勇宣佈未來...

華為公司人工智能 iPhone 雲計算我的第一部5G手機阿里巴巴集團技術 Google 馬雲張勇數據結構能源 CSDN 蘋果公司大數據上海 2019-09-16

'為什麼有人說 Python 的多線程是雞肋？不是真正意義上的多線程？'

"歡迎各位小哥哥小姐姐閱讀本<小生>的文章,對大家學習有幫助,請點贊加關注哦!!!!!!!!!!您的點贊和關注將是我持續更新的動力呢.^v^有不懂的問題可以私聊我哦!問題：1、Python 多線程為什麼耗時更長？2、為什麼在 Python 裡面推薦使用多進程而不...

Python 機器學習中央處理器腳本語言網絡爬蟲 2019-09-15

'陝西菜為什麼沒入選八大菜系？地球知識局'

"(⊙_⊙) 每天一篇全球人文與地理地球知識局——陝西美食饞哭你NO.1126-陝西美食饞哭你作者：牧川製圖：孫綠 / 校稿：貓斯圖 / 編輯：棉花陝菜是每個陝西人都無法割捨的鄉愁。臘汁肉夾饃、涼皮、油潑面、葫蘆頭、梆梆肉、牛羊肉泡饃……這些耳熟能詳的特色美食，都是陝西遊子...

陝西吃在四海八方西安我在宮裡做廚師長安地球文化閩菜漢中粵菜川菜甘肅山西咸陽漢江淮揚菜草魚地理浙菜洋芋擦擦 Google 烹飪技巧高峰木耳溫暖冬至四川寶雞蘇菜涼皮湘菜泡饃肉夾饃渭河渭南呂氏春秋榆林延安徽菜呂不韋羊雜秦嶺油潑辣子西周辣椒魯菜馬鈴薯內蒙古銅川甘草 Google地圖花椒生薑農產品棗子 2019-09-15

'科技時評：蘋果已經沒有夢想，靠什麼應對華為、三星？'

"（本文系紫金財經原創作品，轉載請註明來源）興衰更替有歷史的必然性，其興也勃焉，其亡也忽焉！不過，生活在建國200多年的美國，普通的美國人恐怕很難有中國人厚重的歷史觀。自喬布斯重返蘋果開始，蘋果公司超前、創新的價值理念支撐公司產品一次次驚豔亮相。每一次的蘋果新品發佈會，總能...

iPhone 華為公司我的第一部5G手機蘋果公司三星集團讓夢發生硬件智能手機智能手錶中央處理器史蒂夫·喬布斯高通機器學習麒麟啤酒設計蒂姆·庫克 GPU Apple TV Apple Watch iPad Android 浴霸 IBM 攝影人工智能人生第一份工作腕錶 2019-09-15

'為什麼我們認為新的蘋果 iPhone 11手機在中國市場的銷售不會太好'

"蘋果 iPhone 11手機總體看來：蘋果推出的iPhone 11系列手機未能給亞洲市場留下深刻的印象；蘋果公司昨天宣佈推出全新的iPhone 11系列手機。新機型將於9月20日開始上市，其中包括中國市場。傳統上，iPhone手機在高端市場中非常受歡迎，但過去幾年情況發生...

iPhone 智能手機蘋果公司華為Mate 技術我的第一部5G手機華為手機 Android 照相機華為公司運營商 iOS 小米手機 OPPO 中國電信步步高vivo 三星集團人工智能查爾斯·艾夫斯 2019-09-15

'裸金屬服務器為什麼開始流行起來？'

"顧名思義，裸金屬意味著沒有軟件，只有CPU、內存和存儲。客戶可以通過硬件之上的操作系統提供所有軟件。這意味著專用CPU、能夠完全訪問硬件、可自由地運行定製操作系統。據2016年度市場和市場報告，裸金屬雲市場預計將從2016年的8.718億美元增長到2021年的47億美元，...

IaaS 虛擬機中央處理器軟件 IBM VMware 硬件雲計算 Google Linux 操作系統技術數據庫 Rackspace 微軟亞馬遜阿里巴巴集團 2019-09-14

'為什麼SQL正在擊敗NoSQL，這對未來的數據意味著什麼'

"導讀：經過多年的沉寂之後，今天的SQL正在復出。緣由如何？這對數據社區有什麼影響？看看本文的分析。以下為譯文。自從可以利用計算機做事以來，我們一直在收集的數據以指數級的速度在增長，因此對於數據存儲、處理和分析技術的要求也越來越高。在過去的十年裡，由於SQL無法滿足這些要求...

SQL NoSQL Microsoft SQL Server 數據庫軟件技術 Azure 電腦 PostgreSQL MySQL BigTable MongoDB Hadoop Google MapReduce 亞馬遜公司 Cassandra Spark 工程師 IBM 編程語言 Aurora 程序設計人生第一份工作讀書可視化技術歷史數學 2019-09-14

'北斗衛星即將部署完成，為全球服務，未來可提供釐米級定位精度'

" 9月10日在鄭州舉行中國衛星導航與位置服務第八屆年會，這次大會的主題是“北斗服務全球，融合創新應用！”也就是北斗將會為地球上其他國家提供導航定位服務，同時將會融合未來的高新技術，比如5G物聯網，人工智能大數據等！北斗導航定位系統(BDS)的所有衛星將會在2020年部署完...

北斗衛星導航系統人造衛星 GPS 物聯網我的第一部5G手機技術人工智能無人駕駛大數據無人機俄羅斯 2019-09-14

'為什麼程序員都不喜歡使用 switch 而使用 if else？'

"藍色字體，選擇“標星公眾號”優質文章，第一時間送達請用5秒鐘的時間查看下面的代碼是否存在bug。OK，熟練的程序猿應該已經發現Bug所在了，在第8行和第10行下面我沒有添加關鍵字break;這就導致這段代碼的行為邏輯與我的設計初衷不符了，而最為關鍵的問題是，這個Bug系統...

程序員中央處理器電腦 Kotlin 技術文章 Google 編譯器 2019-09-14

推薦中...