人工智能產品經理系列（七）深入淺出算法下篇

機器學習產品經理大數據人工智能人工智能產品設計人工智能產品設計 2017-10-30

在深入淺出算法上篇中我們給大家簡單介紹了大數據算法的基本知識，以及在面對具體問題和實際應用場景中對大數據算法該如何選擇。今天給大家梳理一下在將算法落地應用時涉及到的數據收集，特徵選擇，算法優化更新等方面的知識。本篇側重大家在面對算法的實際應用時經常遇到的各種常見問題和對應解決方案。

（一）數據收集

人工智能產品經理系列（七）深入淺出算法下篇

在數據收集方案，相對傳統的信息系統的數據質量參差不齊和數據孤島現象，在大數據時代在數據收集方向面臨著更加嚴峻的問題。

首先就是數據的優先級問題，儘管大數據時代越多的數據可能在未來會帶來更強的競爭力和數據壁壘，但是在時機情況中，對數據的收集往往需要排數據的優先級。在預算投入有限、市場時機瞬息萬變的情況下，在實際部署數據採集平臺時是需要有優先順序的。在評價優先級的時候要考慮到行業數據的內在業務屬性含義、數據採集的可持續性以及現有數據質量的情況。

其次，就是建立統一的數據平臺，打破數據孤島的問題，在傳統的信息系統時代，不同系統之間的數據是很難互通的。因此為了打破數據孤島，在大數據時代，首先就是建立統一的數據平臺，各個業務系統和分析系統都是共享一份數據平臺，這樣對數據的存儲共享和高級分析提供了統一的數據基礎。既然建立了數據平臺就務必要考慮到數據治理，

再次，就是對外網數據。由於利用爬蟲技術爬取外網數據需要投入大量的人工成本和維護成本，因此選擇對自己切實有效的外網數據是至關重要的。

（二）特徵選擇

人工智能產品經理系列（七）深入淺出算法下篇

在面對具體的分析任務，需要使用數據平臺的的多維度數據時，如何確定選擇那些維度參與分析。

首先，需要確定要分析的問題，是使用基本的統計分析方法，還是利用機器學習的算法。當僅使用基本的統計分析就可以解決問題時，需要選擇對分析問題有明確影響力的維度，這樣在解釋分析的方案時更具有說服力。

其次，當面對的問題需要使用複雜的機器學習算法時，通常很難直接選擇出所需要的維度信息。面對這種問題時，比較折中的方法就是先選擇感覺跟分析的問題相關的維度信息，當發現選擇的維度信息過少時，可以加入一些暫時認為並不是直接有相關性的維度。很多時候數據中蘊藏的規律性信息是超過我們平時的邏輯關係的。

再次，在選擇維度信息時，需要考慮該維度信息的質量，是否維度統計的相對完整。如果該維度統計的信息缺失率比較高，或者這些數據的差異性較小，則該維度對於整體的分析貢獻是有限的。

（三）算法優化和更新

人工智能產品經理系列（七）深入淺出算法下篇

算法的優化和算法模型的更新，這部分相對來說更加專業一些，本文準備先從宏觀的方法梳理一下實際工作時遇到的具體問題。

首先，就是模型的更新問題，在設計好需要使用機器學習算法的產品功能後，需要考慮多長時間更新一次模型，一週，還是一個月；模型是否能隨著數據的收集變得更加精準，這些都需要在產品開發階段設計好。

其次，面對複雜的算法優化問題，很多人覺得這部分比較晦澀。不同的算法在實際的優化時，可能在參數選擇和調優的方法確實存在著算法獨立性，但是算法的調優和分析方式卻是有章可循的。例如在調節算法的準確度上，通常使用交叉驗證，F1測度等方法，在算法參數的調優上，常見的網格搜索等方法都是高校的分析方法。

最後，在算法優化的過程中，需要建立一套快速的驗證算法準確度的方案。包括選取數據量不能太多，會影響算法的運行時間；算法的測試平臺需要保證較快的運行，因為在實際的調優的情況下需要多次反覆的迭代等。

總結

本文對在算法實際落地時，需要在數據收集，特徵選擇，以及算法優化和更新方法上帶大家回顧了一下需要面對的具體的問題。本文只是簡單帶大家梳理一下通常面對問題時的主流方法，當然在實際工作中，面對具體問題時需要更加系統的設計和完善的方案。在後續的文章中會和大家繼續進一步深入討論。

作者介紹

李智博，機器學習算法工程師，數學專業出身，專注於算法應用多年，在算法工程化方面有著豐富的經驗，擅長將算法理論商用化。

特里，畢業於University of Melbourne，人工智能領域產品經理，專注於AI產品設計、大數據分析、AI技術商用化研究和實踐。

相關推薦

'人工智能算法是如何從數據中學習規律的'

"⾸先我們來看⼀下最常⻅的⼈⼯智能算法是什麼樣的：⼈⼯智能算法包括⼏個部分： x是模型的輸⼊，y是模型的輸出，模型就是對輸⼊轉化為輸出的計算。⽐如輸⼊x可以是⼀張圖⽚（如貓的照⽚），模型對圖⽚進⾏計算處理，然後輸出這張圖⽚上對應的物品的類別（貓）。我們可以把算法理解成⼀...

人工智能算法數學 2019-09-13

'華為P30系列6個月售出1650萬臺，還將為P30pro更新安卓10'

"編者按：最近華為公佈了P30系列的銷量，表示上市6個月銷量已經超過了1650萬臺，同時還將在最近一段時間之內，為P30帶來安卓10，那麼從這一點來看，P30系列的銷量已經表現足夠強勢，至少是完成了既定任務，接下來就要交棒給mate30系列了！6個月售出1650萬臺，p30...

華為公司三星集團智能手機 Android 高通硬件我的第一部5G手機餘承東 iPhone 設計技術攝影 GPU 人工智能京東方 Ultrasone 編譯器 2019-09-12

'17年前的今天 DICE推出了《戰地》系列首部作品《戰地1942》'

"17年前（2002年）的今天，DICE推出了《戰地1942》，登陸了Windows和Mac OS X系統。本作是《戰地》系列首款作品，由瑞典公司DICE開發，EA發行。《戰地1942》當時是採用的Refractor 2引擎開發，支持單人模式遊玩（vs AI）和多人聯網對...

戰地 EA DICE 美國藝電公司轟炸機 OS X 軍艦人工智能航空母艦人生第一份工作 Mac電腦太平洋操作系統歐洲 Windows 意大利第二次世界大戰 2019-09-12

'何為亞馬遜A9算法？原來店鋪產品排名是這樣提升的'

"何為A9算法？就是亞馬遜平臺的一種搜索算法，為亞馬遜上所有排序性的網站產品提供綜合排序算法服務，主要作用根據用戶的搜索，從亞馬遜所有產品類目中里根據相關性排序把最合適的產品展示給客戶。通過A9的網站(https://www.a9.com/)，完美可以看到關於A9的介紹：“...

算法亞馬遜電子商務大數據 Google 2019-09-10

'谷歌廣告推出季節性廣告調整功能，現可用於搜索廣告、展示廣告系列'

"在促銷期間，谷歌的出價算法可以讓你更好地瞭解短期廣告轉換率變化。今年5月谷歌在Google Marketing Live上演示的季節性調整功能，現在可用於搜索和展示廣告系列。為什麼要用谷歌廣告季節性調整功能？谷歌的tCPA和tROAS智能競標策略考慮到了大規模的季節性變化...

Google 算法機器學習高峰 2019-09-08

'《產品經理進階》林中翹：產品經理如何面對人工智能帶來的挑戰'

"近年來，AI行業發展迅猛，2018年全球人工智能市場規模已達2700億元。其中，計算機視覺是AI目前最為成熟應用方向之一，已經湧現出如曠視、商湯、雲從、依圖等知名公司。在所有AI應用的背後，是海量的算法訓練數據。AI所使用深度學習等算法都需要數據來進行訓練，數據量的優質程...

人工智能產品經理大數據技術平安保險金融投資人生第一份工作設計算法銀行 SaaS 工業設計法律設計師百度新聞知乎深度學習頭號大贏家| 理財大賽第二季 2019-09-07

'發力高端產品佈局西鳳酒系列再添一員'

"北京商報訊（記者劉一博實習記者馮若男） 8月30日，“中國紅，紅西鳳，耀世新生”2019紅西鳳全新升級上市發佈會在西安召開。隨著西鳳酒系列又添一款新品的面世，使得百億西鳳目標更加清晰，全國化進程也進入提速期。據瞭解，目前西鳳酒品牌價值1020.32億元，位居白酒行業品...

西鳳酒白酒市場營銷西安原汁原味的德系SUV 人生第一份工作大數據張正 2019-09-06

'「大數據分析」深入淺出：如何從零開始學習大數據分析與挖掘'

"文章梳理了學習大數據挖掘分析的思路與步驟，給大家提供一些參考，希望能夠對你有所幫助。最近有很多人想學習大數據，但不知道怎麼入手，從哪裡開始學習，需要學習哪些東西？對於一個初學者，學習大數據分析與挖掘的思路邏輯是什麼？本文就梳理了如何從0開始學習大數據挖掘分析，學習的步驟思...

數據挖掘大數據數據庫算法機器學習 Python SPSS 可視化技術技術人生第一份工作工程師文章人工智能軟件編程語言深度學習 2019-09-05

'揭祕人工智能深度學習算法的奧祕'

"話說當前最熱門的技術是什麼？我想非人工智能莫屬。雖說大導演斯皮爾伯格在2001年就拍攝了好萊塢大片《人工智能》，但他怎麼又能想到十幾年後人類在人工智能領域紮紮實實得走出了一大步——以阿爾法機器人為代表的人工智能橫空出世，在圍棋上戰勝了人類最強棋手。具備學習思考能力的機器人...

人工智能深度學習算法電腦機器學習技術機器人九陽神功文章 2019-09-03

'招商固收·深度 | 高收益債定價，回收率測算及海外經驗——高收益債探祕系列之一'

"【摘要】美國高收益債極簡史：“歪打正著”的成長路徑，經歷三個階段：1）20世紀80年代，併購潮的開始，高收益債幾乎作為中小企業主動加槓桿的工具，2）80年代末期和90年代初期後，宏觀景氣度的下滑與槓桿收購價值未能兌現產生共振，高收益債供給規模出現萎縮，3）90年代中後期，...

穆迪公司投資銀行高能小子終極裝備美國證監會標準普爾金融惠譽國際設計大數據 2019-09-01

'說出來你可能不信，現在連酒廠都在招算法工程師'

"原創：HyperAI超神經關鍵詞：啤酒智能釀造數據顯示，從 1960 年代至今，啤酒的受歡迎程度每年增加，逐漸成為了消耗量最大的飲品之一。到 2017 年的統計數據，中國人均啤酒年消耗達到了 60 瓶之多。每一杯啤酒，都蘊藏著複雜的製作工藝從釀製配方、發酵技術、再到殺菌...

啤酒工程師技術算法人工智能酵母嘉士伯蛇麻原汁原味的德系SUV 百威微軟物聯網電腦大學青島 2019-09-01

'人工智能算法預測雙色球2019101期10注號碼'

"人工智能算法預測雙色球2019100期10注號碼中了二注4+0和1+1其它號碼比較接近！人工智能算法預測雙色球2019101期10注號碼如下，僅供大家參考，希望大家理性對待!02 11 14 16 20 25+0809 16 20 22 24 30+0805 07 12 ...

人工智能算法 2019-08-30

'人工智能簡史系列-06-穩健時代'

"人工智能通識全部文章目錄列表成熟的標準就是懂得低調，懂得務實，去盡浮華，專注真正的價值。經歷兩次大起大落的人工智能行業終於在世紀之交找到了自己應有的產業定位。弗諾·芬奇的奇點理論只會讓人感到不安。經歷過半個世紀風雨起伏的人工智能行業，終於學會了低調行事。在此後的近二十年，...

人工智能技術掃地機器人機器人電腦無人駕駛算法 iRobot 神經科學吳恩達 GPU Google 中央處理器語音識別技術 IBM 本田技研工業傑弗裡·辛頓高能小子終極裝備人生第一份工作硬件文章吸塵器科幻小說斯坦福大學設計軟件工程 2019-08-28

'兆易創新推出GD32V系列RISC—V內核32位通用MCU新品'

"現在，直接使用GD32V系列32位通用MCU以創意靈感擁抱RISC-V的開發世界！業界領先的半導體供應商兆易創新GigaDevice（股票代碼603986）宣佈，在行業內率先將開源指令集架構RISC-V引入通用微控制器領域，正式推出全球首個基於RISC-V內核的GD32V...

設計 ARM 硬件技術集成開發環境 Linux 人工智能 Flash 物聯網 2019-08-26

'一桶泡麵就可以看出產品經理的文化水平'

"今日Talker：空手來源：空手編輯：津津對於一名產品經理來說，他的工作核心始終圍繞著需求展開。何種用戶有著何種需求？是真需求還是假需求？是剛需還是可有可無的需求？需求在什麼場景下發生？用戶需求背後的根本動機為何？對於需求理解層次的深淺，決定了一名產品經理能力的高低。提到...

美食啤酒牛肉麵酸菜康師傅產品經理筍乾紅燒肉燒烤火鍋白酒獅子頭雪裡蕻川菜文化吃在四海八方梅菜紅燒牛肉海底撈人生第一份工作扣肉市場營銷西紅柿燒豬小雞燉蘑菇花旗參 2019-08-25

'《黑客帝國》系列都要出四了，你還沒看懂前三部嗎？'

"近日，華納兄弟公司董事長託比·默裡奇宣佈《黑客帝國》將拍攝第四部，原班人馬悉數迴歸！基努·裡維斯將回歸飾演Neo，凱莉-安·莫斯迴歸飾演Trinity，原導演拉娜·沃卓斯基也繼續執導。今年也正好是《黑客帝國》上映20週年！小編忍不住說一句，真是活久見啊！首先，《黑客帝國》...

黑客帝國人工智能華納兄弟戀愛基努·裡維斯 2019-08-22

'人工智能會不會覺醒——計算機算法的侷限'

"系列文章《人工智能會不會覺醒》之第三篇計算機算法的侷限其實，計算機上的所有行為都可以轉換為數學和邏輯運算。如果把計算機的行為抽象出來看，無非就是輸入、計算、輸出這樣三個過程。例如你在屏幕上點一下“磨皮”的按鈕，這個叫輸入，經過一定的運算後，返回你一張更漂亮的自拍照，這個...

算法人工智能電腦數學集合論阿爾伯特·愛因斯坦庫爾特·哥德爾人生第一份工作 2019-08-22

'Hulu：視頻廣告系統中的算法實踐'

"分享嘉賓：韋春陽 Hulu編輯整理：Hoh Xil內容來源：AI 科學前沿大會出品社區：DataFun注：歡迎轉載，轉載請註明出處導讀：Hulu 是一家美國領先的互聯網專業視頻服務平臺，商業廣告是 Hulu 的重要變現手段之一。視頻網站中的廣告以擔保合約式品牌廣告為主，本...

Hulu 算法人工智能技術設計 2019-08-22

'產品經理“聖經”推出續篇，天旦產品與增長副總裁受邀作序'

"上海2019年8月20日 /美通社/ -- 日前，天旦產品與增長副總裁賀曉麟先生受邀為即將出版發行的《啟示錄》第二版作序。在出版前夕，賀總特別接受專訪，說說與《啟示錄》作者Marty Cagan的淵源，併為讀者搶先透露新書的精華與亮點。在科技公司的產品經理圈，有一本大名鼎...

聖經產品經理 B2B 讀書創業上海人生第一份工作金融世界末日 2019-08-22

'人工智能算法預測雙色球2019096期10注號碼'

"人工智能算法預測雙色球2019095期10注號碼中了一注2+1，繼續預測!人工智能算法預測雙色球2019096期10注號碼如下，僅供大家參考，希望大家理性對待!15 17 18 19 21 27+1201 03 09 17 19 26+0801 04 07 09 29 3...

人工智能算法 2019-08-21

推薦中...