'神奇的推薦系統:用得好,銷量倍增'
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
推薦系統使用的方法
下面將簡單概述一下每種方法:
基於內容過濾
基於內容過濾的項目根據項目本身的屬性來推薦。基於內容的過濾器所做的推薦使用個人的歷史信息來通知所顯示的選項。這種推薦系統尋找人們過去購買或喜歡的項目或產品之間的相似性,以便在未來進行推薦。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
推薦系統使用的方法
下面將簡單概述一下每種方法:
基於內容過濾
基於內容過濾的項目根據項目本身的屬性來推薦。基於內容的過濾器所做的推薦使用個人的歷史信息來通知所顯示的選項。這種推薦系統尋找人們過去購買或喜歡的項目或產品之間的相似性,以便在未來進行推薦。
基於內容過濾
例如,如果用戶喜歡某一本「文學」類書籍,那麼向該用戶推薦同一類別的書籍是有意義的。此外,推薦同一作者在同一年發行的其它作品也是一個好主意。這就是基於內容過濾的工作原理。
這種方法的優點是我們不需要很多次交易來構建模型,因為我們只需要有關產品的信息。然而,缺點是該模型沒有從交易中學習,因此隨著時間的推移,基於內容的系統性能沒有太大的改進。
協同過濾
協同過濾使用多個用戶/客戶提供的綜合評分來進行推薦。意思是根據其他人的協同行為來推薦物品。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
推薦系統使用的方法
下面將簡單概述一下每種方法:
基於內容過濾
基於內容過濾的項目根據項目本身的屬性來推薦。基於內容的過濾器所做的推薦使用個人的歷史信息來通知所顯示的選項。這種推薦系統尋找人們過去購買或喜歡的項目或產品之間的相似性,以便在未來進行推薦。
基於內容過濾
例如,如果用戶喜歡某一本「文學」類書籍,那麼向該用戶推薦同一類別的書籍是有意義的。此外,推薦同一作者在同一年發行的其它作品也是一個好主意。這就是基於內容過濾的工作原理。
這種方法的優點是我們不需要很多次交易來構建模型,因為我們只需要有關產品的信息。然而,缺點是該模型沒有從交易中學習,因此隨著時間的推移,基於內容的系統性能沒有太大的改進。
協同過濾
協同過濾使用多個用戶/客戶提供的綜合評分來進行推薦。意思是根據其他人的協同行為來推薦物品。
有兩種協同過濾的方法:
1. 基於記憶的方法,也稱為基於鄰域的協同過濾算法,其中用戶-項目組合的評分是根據其鄰域來預測的。這些鄰域可以進一步通過以下兩種方式來定義:
- 基於用戶的協同過濾
找到其他與你類似的人並推薦他們喜歡的東西。
- 基於商品的協同過濾
推薦那些也買了你喜歡的東西的人所買的東西。
2. 基於模型的方法。該方法使用機器學習方法,將問題當做普通的機器學習問題,來提取對評分數據的預測。可以使用 PCA、SVD、矩陣分解、聚類、神經網絡等技術。
基於集成的混合過濾
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
推薦系統使用的方法
下面將簡單概述一下每種方法:
基於內容過濾
基於內容過濾的項目根據項目本身的屬性來推薦。基於內容的過濾器所做的推薦使用個人的歷史信息來通知所顯示的選項。這種推薦系統尋找人們過去購買或喜歡的項目或產品之間的相似性,以便在未來進行推薦。
基於內容過濾
例如,如果用戶喜歡某一本「文學」類書籍,那麼向該用戶推薦同一類別的書籍是有意義的。此外,推薦同一作者在同一年發行的其它作品也是一個好主意。這就是基於內容過濾的工作原理。
這種方法的優點是我們不需要很多次交易來構建模型,因為我們只需要有關產品的信息。然而,缺點是該模型沒有從交易中學習,因此隨著時間的推移,基於內容的系統性能沒有太大的改進。
協同過濾
協同過濾使用多個用戶/客戶提供的綜合評分來進行推薦。意思是根據其他人的協同行為來推薦物品。
有兩種協同過濾的方法:
1. 基於記憶的方法,也稱為基於鄰域的協同過濾算法,其中用戶-項目組合的評分是根據其鄰域來預測的。這些鄰域可以進一步通過以下兩種方式來定義:
- 基於用戶的協同過濾
找到其他與你類似的人並推薦他們喜歡的東西。
- 基於商品的協同過濾
推薦那些也買了你喜歡的東西的人所買的東西。
2. 基於模型的方法。該方法使用機器學習方法,將問題當做普通的機器學習問題,來提取對評分數據的預測。可以使用 PCA、SVD、矩陣分解、聚類、神經網絡等技術。
基於集成的混合過濾
混合過濾
基於內容和協同過濾的方法都有各自的優缺點,通過將多個算法結合在一起(即混合方法),我們可以獲得一個更好的系統。混合系統利用商品數據和交易數據來進行推薦。
Netflix 就是使用混合方法的很好例子。在 Netflix 裡,推薦不僅僅基於人們的觀看和搜索習慣(協同系統),而且還基於具有類似特徵(基於內容)的電影。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
推薦系統使用的方法
下面將簡單概述一下每種方法:
基於內容過濾
基於內容過濾的項目根據項目本身的屬性來推薦。基於內容的過濾器所做的推薦使用個人的歷史信息來通知所顯示的選項。這種推薦系統尋找人們過去購買或喜歡的項目或產品之間的相似性,以便在未來進行推薦。
基於內容過濾
例如,如果用戶喜歡某一本「文學」類書籍,那麼向該用戶推薦同一類別的書籍是有意義的。此外,推薦同一作者在同一年發行的其它作品也是一個好主意。這就是基於內容過濾的工作原理。
這種方法的優點是我們不需要很多次交易來構建模型,因為我們只需要有關產品的信息。然而,缺點是該模型沒有從交易中學習,因此隨著時間的推移,基於內容的系統性能沒有太大的改進。
協同過濾
協同過濾使用多個用戶/客戶提供的綜合評分來進行推薦。意思是根據其他人的協同行為來推薦物品。
有兩種協同過濾的方法:
1. 基於記憶的方法,也稱為基於鄰域的協同過濾算法,其中用戶-項目組合的評分是根據其鄰域來預測的。這些鄰域可以進一步通過以下兩種方式來定義:
- 基於用戶的協同過濾
找到其他與你類似的人並推薦他們喜歡的東西。
- 基於商品的協同過濾
推薦那些也買了你喜歡的東西的人所買的東西。
2. 基於模型的方法。該方法使用機器學習方法,將問題當做普通的機器學習問題,來提取對評分數據的預測。可以使用 PCA、SVD、矩陣分解、聚類、神經網絡等技術。
基於集成的混合過濾
混合過濾
基於內容和協同過濾的方法都有各自的優缺點,通過將多個算法結合在一起(即混合方法),我們可以獲得一個更好的系統。混合系統利用商品數據和交易數據來進行推薦。
Netflix 就是使用混合方法的很好例子。在 Netflix 裡,推薦不僅僅基於人們的觀看和搜索習慣(協同系統),而且還基於具有類似特徵(基於內容)的電影。
混合系統的工作原理
評估推薦系統:圍繞準確率的炒作
用戶並不真正關心準確率
目前並沒有直接的方法來衡量推薦系統有多準確。這領域的許多研究往往集中在預測用戶對他們尚未打分的所有東西的評分問題上,是好是壞。但這與推薦系統在現實中所要做的大有不同。測量準確率並不是我們想要推薦系統做的事。那麼,為什麼均方根誤差(RMSE)和準確率在推薦系統領域中非常重要呢?
其實,其中很多可以追溯到 2006 年,當時 Netflix 宣佈了著名的「100 萬美元獎金挑戰賽」。比賽的內容是擊敗其 0.9525 的 RMSE,並將它降至 0.8572 及以下。由於該獎項的重點是 RMSE,因此人們只專注它,而這種影響一直持續到今天。
我們之前發過兩篇關於推薦系統的文章,都比較淺顯易懂,但不夠全面,而且結合的實例也不夠。本篇文章是另一個作者寫的,內容還算全面,深入淺出地向我們介紹了常用的推薦系統、推薦系統的目標和工作原理等。
推薦系統概述&它們是如何提供有效的目標營銷形式
很多時候人們並不知道自己想要什麼,直到你把東西呈給他們看——史蒂夫·喬布斯
以下節選自克里斯·安德森的《長尾理論》一書:「在 1988 年,一位名叫喬·辛普森的英國登山者寫了一本書,名為《觸摸巔峰》,這本書講述了他在祕魯安第斯山脈接近死亡的痛苦經歷。這本書得到了很高的評價,但僅僅是一個小成功,很快就被人們遺忘了。十年後,一件奇怪的事發生了。喬恩·克拉考爾寫了另一本關於登山悲劇的書《進入空氣稀薄地帶》,這本書引起了出版界的轟動。突然,《觸摸巔峰》又開始熱銷了。」
過了一段時間後,《觸摸巔峰》的銷量甚至超過了《進入空氣稀薄地帶》。但到底發生了什麼呢?實際上由於這兩本書都是基於同一個主題的,亞馬遜認為喜歡《進入空氣稀薄地帶》的讀者也可能會喜歡《觸摸巔峰》並給予了推薦。人們看到推薦後買了書,然後發現自己實際上很喜歡這本書,因此寫了積極的評論,然後導致了更高的銷售量,最終導致更多的推薦,從而形成正反饋循環。這就是推薦系統的威力。
推薦系統有哪些?
推薦引擎試圖向人們推薦產品或者服務。從某種程度上來說,推薦系統試圖縮小人們的選擇範圍,為他們提供其最有可能購買或使用的產品或服務。推薦系統幾乎無處不在,比如亞馬遜、Netflix、Facebook、領英。事實上,亞馬遜光靠推薦就能獲得大部分收入。而像 Youtube 和 Netflix 這樣的公司則依靠推薦引擎來幫助用戶發現新的內容。以下為我們日常生活中的一些推薦系統用例:
亞馬遜
亞馬遜根據其數百萬客戶的數據來確定哪些商品通常是一起購買的,並以此為基礎來進行推薦。亞馬遜網站上的推薦是基於明確的評分、購買行為和歷史瀏覽記錄來提供的。
我本來想買《Show Dog》,但最後還買了《The Compound effect》!
領英
領英根據你過去的經歷、當前的職位頭銜和背書來向你建議可能的工作。
Netflix
當我們在 Netflix 上對一部電影評分或設置我們的偏好時,它用這些數據和來自其他數百個用戶的類似數據來推薦電影和節目。然後 Netflix 又使用這些評分和操作來進行推薦。
像 Facebook 這類的推薦系統並不直接推薦產品,而是推薦聯繫人。
除此之外,像 Spotify、Youtube、互聯網電影資料庫(IMDB)、貓途鷹(Trip Advisor)、谷歌新聞(Google News)等許多其他平臺都在不斷地給我們提供推薦和建議來滿足我們的需求。
為什麼要用推薦系統?
當今網上商店正在蓬勃發展,我們幾乎可以通過點擊鼠標來獲得任何商品。然而,在傳統實體店的時代,商店的儲存空間有限,因此店主只能展示最受歡迎的商品,這意味著很多即使像書或 CD 這類質量好的商品也沒有被展出。簡而言之,店主必須預先對商品進行篩選。
然而,網購行業改變了這種情況。因為有無限的空間,所以不需要預先過濾。相反,這導致了一種後來被稱為「長尾效應」的現象。
長尾現象
這種效應意思是受歡迎的少量商品在線上和線下商店都能找到。相反地,不太受歡迎的商品卻佔大多數並只能在網上商店找到,它們最終形成了長尾現象。然而,不受歡迎的商品也可能是好的,但在網站上找到這樣的產品是一項艱鉅的任務,並需要某種過濾器。這樣的過濾器實際上就構成了推薦系統。
推薦系統的用法
推薦系統主要用於解決以下兩個問題:
預測版本
此版本用於預測用戶-項目組合的評分值。在這種情況下,我們以用戶提供的評分作為訓練數據。其目的是利用這些數據對用戶沒有交互的商品預測其評分。
排序版本
老實說,沒有必要為了進行推薦而預測特定商品的用戶評分。在線零售商或電子商務公司並不太關心用戶的預測。相反,他們更感興趣的是列出一個有限的清單,能給特定的人群列出最好的東西來呈現給他們。此外,客戶並不想看到系統對某個商品的評分進行預測的能力,他們只想看到自己可能喜歡的東西。
推薦引擎的成功取決於它能為人們找到最佳的推薦,因此它的意義在於找到人們可能會喜歡的東西,而不是可能討厭的東西。
推薦系統的目標
只有推薦有相關性時才會有價值
推薦系統的最終目標是增加公司的銷售額。為了實現這一點,推薦系統應該只向用戶展示或提供有意義的商品。查魯·C·阿加沃爾在他的書《推薦系統》中總結了推薦引擎的期望目標,包括以下四點:
相關性
推薦的東西只有和用戶相關才會有意義。用戶更有可能購買或消費他們感興趣的商品。
新穎性
除了相關性之外,新穎性也是另一個重要因素。如果推薦的項目是用戶以前沒有看過或消費過的,那麼推薦也將更有意義。
偶然性
有時推薦一些出乎意料的項目也能促進銷售。然而,偶然性與新穎性不同。引用作者的話:「如果一家新的印度餐廳在附近開業,那麼對通常吃印度菜的用戶推薦該餐廳就是新穎的,但不一定是偶然的。另一方面,如果向該用戶推薦埃塞俄比亞餐廳,並且用戶不知道這種食物可能對她有吸引力時,那麼推薦是偶然的。」
多樣性
此外,增加推薦的多樣性也同樣重要。簡單地推薦與此類似的商品並沒有多大用處。
推薦系統的實現原理
那麼推薦系統是如何起作用的呢?假設亞馬遜想向你展示圖書類別的前十個推薦。在這裡,亞馬遜的推薦系統將根據一些關於你的數據開始來確定你的個人品味和興趣。然後,它會將這些關於你的數據和與你類似的人的集體行為合併起來,然後向你推薦你可能喜歡的東西。但是這些關於你喜歡什麼、不喜歡什麼的數據從哪裡來呢?
推薦引擎中的數據流
用戶的偏好數據通過以下兩種方式進行收集:
顯式數據
要求用戶以 1 到 5 星為一個項目進行評分或者對看到的內容表示喜歡或不喜歡,是一個收集顯式數據的例子。在這些情況下,推薦系統會明確地詢問用戶是否喜歡某個特定的項目,然後這些數據被用來構建關於該用戶興趣的檔案。
但是,這樣有一個缺點,因為不是每個用戶都會留下反饋或評分,即使他們留下評分,對不同的人來說也可能意味著不同。例如,一個 3 星的評分對一個人來說可能還不錯,但對另一個人來說可能只是平均。
隱式數據
隱式數據源於用戶與網站之間的交互,並將其解釋為感興趣或不感興趣的跡象。例如,從亞馬遜購買商品或觀看完整的 YouTube 視頻片段被認為是一種感興趣的積極表現。隱式交互可以提供更多的數據,對於購買行為的數據,它甚至可能是更好的數據來源。
推薦系統的基本模型
目前業內使用的推薦系統有很多種。然而,重要的是決定哪種類型適應我們的需求以及我們可以使用哪種數據。選擇主要取決於:
- 我們想要識別的內容
- 我們的數據中指定了哪種類型的關係
一些常用的推薦方法包括:
推薦系統使用的方法
下面將簡單概述一下每種方法:
基於內容過濾
基於內容過濾的項目根據項目本身的屬性來推薦。基於內容的過濾器所做的推薦使用個人的歷史信息來通知所顯示的選項。這種推薦系統尋找人們過去購買或喜歡的項目或產品之間的相似性,以便在未來進行推薦。
基於內容過濾
例如,如果用戶喜歡某一本「文學」類書籍,那麼向該用戶推薦同一類別的書籍是有意義的。此外,推薦同一作者在同一年發行的其它作品也是一個好主意。這就是基於內容過濾的工作原理。
這種方法的優點是我們不需要很多次交易來構建模型,因為我們只需要有關產品的信息。然而,缺點是該模型沒有從交易中學習,因此隨著時間的推移,基於內容的系統性能沒有太大的改進。
協同過濾
協同過濾使用多個用戶/客戶提供的綜合評分來進行推薦。意思是根據其他人的協同行為來推薦物品。
有兩種協同過濾的方法:
1. 基於記憶的方法,也稱為基於鄰域的協同過濾算法,其中用戶-項目組合的評分是根據其鄰域來預測的。這些鄰域可以進一步通過以下兩種方式來定義:
- 基於用戶的協同過濾
找到其他與你類似的人並推薦他們喜歡的東西。
- 基於商品的協同過濾
推薦那些也買了你喜歡的東西的人所買的東西。
2. 基於模型的方法。該方法使用機器學習方法,將問題當做普通的機器學習問題,來提取對評分數據的預測。可以使用 PCA、SVD、矩陣分解、聚類、神經網絡等技術。
基於集成的混合過濾
混合過濾
基於內容和協同過濾的方法都有各自的優缺點,通過將多個算法結合在一起(即混合方法),我們可以獲得一個更好的系統。混合系統利用商品數據和交易數據來進行推薦。
Netflix 就是使用混合方法的很好例子。在 Netflix 裡,推薦不僅僅基於人們的觀看和搜索習慣(協同系統),而且還基於具有類似特徵(基於內容)的電影。
混合系統的工作原理
評估推薦系統:圍繞準確率的炒作
用戶並不真正關心準確率
目前並沒有直接的方法來衡量推薦系統有多準確。這領域的許多研究往往集中在預測用戶對他們尚未打分的所有東西的評分問題上,是好是壞。但這與推薦系統在現實中所要做的大有不同。測量準確率並不是我們想要推薦系統做的事。那麼,為什麼均方根誤差(RMSE)和準確率在推薦系統領域中非常重要呢?
其實,其中很多可以追溯到 2006 年,當時 Netflix 宣佈了著名的「100 萬美元獎金挑戰賽」。比賽的內容是擊敗其 0.9525 的 RMSE,並將它降至 0.8572 及以下。由於該獎項的重點是 RMSE,因此人們只專注它,而這種影響一直持續到今天。
圖源:https://www.netflixprize.com/
有趣的是,三年挑戰賽中出現的大部分算法從未集成到 Netflix 中。正如 Netflix 博客中所討論的那樣:
你可能想知道兩年後贏得 100 萬美元獎金終極大獎的集成算法怎麼樣了……我們離線評估了一些新方法,但我們測試的附加準確率增益似乎並不適合引入生產環境。
我們的業務目標是最大限度地提高會員滿意度和月到月的訂閱保留率……現在很明顯,Netflix 獎的目標——準確預測電影評級,只是高效推薦系統的眾多組成部分之一,該系統可以改善會員的享受。
結論
在本文中,我們概述了推薦系統,以及它們如何通過為每個客戶創建個性化的購物體驗來提供有效的目標營銷形式。然而,我們沒有更深入地探討各種推薦方法。這是因為每種方法都相當廣泛,需要詳細討論。因此,在下一篇文章中,我將詳細討論推薦方法的工作原理及其優缺點。