'《簡單統計學》:被大數據裹挾的現代人，如何識破那些愚蠢的理論'

麻疹何潔的瘦身花路大數據自閉症文章百度英國知乎耶魯大學不完美媽媽天花梅廷芳讀書會 2019-09-02

如果生活中遇到了問題，你會怎麼辦？

我想大多數人都會去百度一下，所謂內事不決問老婆，外事不決問百度。

但是，百度得來的答案層次不齊，有些更是具有誤導性，2017年魏則西事件就是明證。

對此，有人會去專門的問答平臺找答案，例如知乎和今日頭條的悟空問答，這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識，有些答案事實而非，也缺乏專業性和科學性。

為了解決這個問題，有人會直接閱讀論文，因為論文具有科學性和真實性。

首先論文的作者，是具有一定造詣的專業人士；其次，論文有大量的數據作為基礎；最後，論文的發表需要雜誌社進行層層審核（同行評議），綜合下來，論文的內容是最值得信賴的。

直接百度答案層次不齊，問答平臺事實而非，那麼經過同行評議以後的專業論文，就能夠完全相信、一勞永逸了嗎？

今天我想和大家聊的這本《簡單統計學》，探討的就是這個問題。

如果生活中遇到了問題，你會怎麼辦？

我想大多數人都會去百度一下，所謂內事不決問老婆，外事不決問百度。

但是，百度得來的答案層次不齊，有些更是具有誤導性，2017年魏則西事件就是明證。

對此，有人會去專門的問答平臺找答案，例如知乎和今日頭條的悟空問答，這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識，有些答案事實而非，也缺乏專業性和科學性。

為了解決這個問題，有人會直接閱讀論文，因為論文具有科學性和真實性。

直接百度答案層次不齊，問答平臺事實而非，那麼經過同行評議以後的專業論文，就能夠完全相信、一勞永逸了嗎？

今天我想和大家聊的這本《簡單統計學》，探討的就是這個問題。

簡單統計學

它的作者是耶魯大學的統計學博士加里▪史密斯，他認為有些人誤用了統計學，得出了錯誤的結論；有些則故意錯誤使用統計學，得出了自己想要的結論，而這些結論都偏離事實。

01 故意用錯統計學

在美國和英國這樣的發達國家，疫苗的接種率很低，遠遠沒有一些小國、窮國的接種率高，例如窮國斯里蘭卡的接種率就要比美國和英國高。

現代醫學發展到今天，我們都知道，接種疫苗是預防疾病最有效的方式之一，天花之所以能被消滅，就是因為疫苗的功勞，而HIV之所以猖獗，最根本原因就在於目前還沒有HIV疫苗。

那英國和美國的家長，為什麼不願意讓自家的孩子接種疫苗呢？他們難道不知道接種疫苗的好處嗎？

要查找原因，還得從1998年的一篇文章開始說起。

那一年，英國醫生韋克菲爾德和他的合作者一起，在著名的醫學雜誌《柳葉刀》上發表了一篇論文，論文的結論是：12名正常兒童在接種麻疹、腮腺炎和風疹疫苗以後，患上了自閉症。

文章一出來，輿論頓時譁然，很多家長非常焦慮，畢竟自閉症比感染麻腮風的危害要大。

於是，他們停止了正常的接種程序，不再給孩子接種疫苗。

事情並沒有完，有人試圖複製韋克菲爾德的研究結果，但不論怎麼努力，始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

為此，一位名為賴恩▪迪爾的記者開展了調查，調查的結果是，韋克菲爾德使用的數據與英國官方的數據不符，並且韋克菲爾德聲稱患上自閉症的12名兒童中，只有1人確診患有自閉症，其他11人都是健康的。

也就是說，韋克菲爾德使用了錯誤的數據，最終得出錯誤的結論。

那麼他為什麼要這樣做呢？

賴恩▪迪爾進一步調查發現，韋克菲爾德計劃推出替代性疫苗，他認為，新疫苗才是安全的，與此同時，韋克菲爾德也與律師合作，希望對疫苗生產商提起訴訟，從而獲得豐厚的回報。

2010年，《柳葉刀》雜誌撤銷了韋克菲爾德的文章，同時英國醫學會弔銷了他的行醫執照。

真相得以大白，但影響卻並沒有就此停止，因為這篇文章的緣故，英國的麻疹接種率從92%跌至不到80%，麻疹並也從1998年的56例，增加到2008年的1348例。

如果生活中遇到了問題，你會怎麼辦？

我想大多數人都會去百度一下，所謂內事不決問老婆，外事不決問百度。

但是，百度得來的答案層次不齊，有些更是具有誤導性，2017年魏則西事件就是明證。

對此，有人會去專門的問答平臺找答案，例如知乎和今日頭條的悟空問答，這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識，有些答案事實而非，也缺乏專業性和科學性。

為了解決這個問題，有人會直接閱讀論文，因為論文具有科學性和真實性。

直接百度答案層次不齊，問答平臺事實而非，那麼經過同行評議以後的專業論文，就能夠完全相信、一勞永逸了嗎？

今天我想和大家聊的這本《簡單統計學》，探討的就是這個問題。

簡單統計學

01 故意用錯統計學

在美國和英國這樣的發達國家，疫苗的接種率很低，遠遠沒有一些小國、窮國的接種率高，例如窮國斯里蘭卡的接種率就要比美國和英國高。

那英國和美國的家長，為什麼不願意讓自家的孩子接種疫苗呢？他們難道不知道接種疫苗的好處嗎？

要查找原因，還得從1998年的一篇文章開始說起。

文章一出來，輿論頓時譁然，很多家長非常焦慮，畢竟自閉症比感染麻腮風的危害要大。

於是，他們停止了正常的接種程序，不再給孩子接種疫苗。

事情並沒有完，有人試圖複製韋克菲爾德的研究結果，但不論怎麼努力，始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

也就是說，韋克菲爾德使用了錯誤的數據，最終得出錯誤的結論。

那麼他為什麼要這樣做呢？

2010年，《柳葉刀》雜誌撤銷了韋克菲爾德的文章，同時英國醫學會弔銷了他的行醫執照。

真相得以大白，但影響卻並沒有就此停止，因為這篇文章的緣故，英國的麻疹接種率從92%跌至不到80%，麻疹並也從1998年的56例，增加到2008年的1348例。

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說，最喜歡的數字是0.05，而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗，簡單來理解，顯著性檢驗就是看兩組不同的數據，是否存在差異。

例如，小王為了減肥，服用了某公司的減肥產品，服用減肥產品前後小王的體重見下表。

如果生活中遇到了問題，你會怎麼辦？

我想大多數人都會去百度一下，所謂內事不決問老婆，外事不決問百度。

但是，百度得來的答案層次不齊，有些更是具有誤導性，2017年魏則西事件就是明證。

對此，有人會去專門的問答平臺找答案，例如知乎和今日頭條的悟空問答，這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識，有些答案事實而非，也缺乏專業性和科學性。

為了解決這個問題，有人會直接閱讀論文，因為論文具有科學性和真實性。

直接百度答案層次不齊，問答平臺事實而非，那麼經過同行評議以後的專業論文，就能夠完全相信、一勞永逸了嗎？

今天我想和大家聊的這本《簡單統計學》，探討的就是這個問題。

簡單統計學

01 故意用錯統計學

在美國和英國這樣的發達國家，疫苗的接種率很低，遠遠沒有一些小國、窮國的接種率高，例如窮國斯里蘭卡的接種率就要比美國和英國高。

那英國和美國的家長，為什麼不願意讓自家的孩子接種疫苗呢？他們難道不知道接種疫苗的好處嗎？

要查找原因，還得從1998年的一篇文章開始說起。

文章一出來，輿論頓時譁然，很多家長非常焦慮，畢竟自閉症比感染麻腮風的危害要大。

於是，他們停止了正常的接種程序，不再給孩子接種疫苗。

事情並沒有完，有人試圖複製韋克菲爾德的研究結果，但不論怎麼努力，始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

也就是說，韋克菲爾德使用了錯誤的數據，最終得出錯誤的結論。

那麼他為什麼要這樣做呢？

2010年，《柳葉刀》雜誌撤銷了韋克菲爾德的文章，同時英國醫學會弔銷了他的行醫執照。

真相得以大白，但影響卻並沒有就此停止，因為這篇文章的緣故，英國的麻疹接種率從92%跌至不到80%，麻疹並也從1998年的56例，增加到2008年的1348例。

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說，最喜歡的數字是0.05，而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗，簡單來理解，顯著性檢驗就是看兩組不同的數據，是否存在差異。

例如，小王為了減肥，服用了某公司的減肥產品，服用減肥產品前後小王的體重見下表。

小王減肥前後數據

乍一看，減肥前平均體重是56千克，減肥後平均體重是55千克，減肥成功，減肥產品有效。

這個時候，統計學家跳出來說，不能這樣簡單粗暴的比，因為在稱重的時候會產生誤差（就是真實值和稱重值之間的差），這1千克，到底是減肥產品的作用，還是因為稱重誤差帶來的減輕，誰也不知道，必須經過統計學計算才行。

於是，統計學家重新計算，得出一個p值，如果p值小於0.05，那麼小王因為稱重誤差引起的減輕是小概率事件。

也就是說，如果p值小於0.05，那麼小王的體重減輕，是因為減肥產品的作用，不是稱重誤差帶來的，說明減肥成功，具有顯著性效果。

如果p值大於0.05（大概率事件），那麼小王的體重減輕，是因為稱重誤差帶來的，並不是減肥產品的作用，減肥失敗，沒有顯著性效果。

補充一下概率論知識，如果一件事情出現的可能性大於95%（0.95），就是大概率事件，如果小於5%（0.05），就是小概率事件。

經過計算，小王減肥前後體重的p值是0.386，大於0.05，沒有顯著性差異，小王的體重減輕，是因為稱重誤差帶來的，她減肥失敗，沒有顯著性效果。

小王只能哭暈在廁所。

正因為有了顯著性檢驗（0.05），科研人員開始大殺四方。

例如，用澱粉來治療疼痛，通過和原來的止痛藥進行顯著性檢驗，發現p值小於0.05。

結論是：在治療疼痛中，澱粉的作用比原來的止痛藥明顯，於是製藥公司開始瘋狂銷售澱粉。畢竟實驗科學嚴謹，還有數據支持。

每年，製藥公司都會對成百上千的新藥進行顯著性檢驗，即便實驗設計良好，還是會有一些毫無效果的藥物，表現出具有統計顯著性效果。

而這可以給製藥公司帶來源源不斷的利潤。

與之相反的例子是，美國對健康男性實施前列腺癌的普查，在花費了大量的人力物力和財力以後發現，這項普查毫無意義。

普查前後進行顯著性檢驗，p值大於0.05，沒有顯著性差異。

《簡單的統計學》說出了這樣一個事實。

一位名叫約翰▪約安尼季斯的醫生，針對45項備受尊敬的醫學研究發現，只有20項被人用更大規模的樣本進行了檢驗，複製出當時的研究結果，複製成功的比例是44%。

這還是備受尊敬的研究成果，如果是一般的研究成果，能夠複製的比例只會更低。

為此，他還寫了一篇名為“為什麼大多數得到發表的研究結果都是錯誤的”的文章。

如果生活中遇到了問題，你會怎麼辦？

我想大多數人都會去百度一下，所謂內事不決問老婆，外事不決問百度。

但是，百度得來的答案層次不齊，有些更是具有誤導性，2017年魏則西事件就是明證。

對此，有人會去專門的問答平臺找答案，例如知乎和今日頭條的悟空問答，這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識，有些答案事實而非，也缺乏專業性和科學性。

為了解決這個問題，有人會直接閱讀論文，因為論文具有科學性和真實性。

直接百度答案層次不齊，問答平臺事實而非，那麼經過同行評議以後的專業論文，就能夠完全相信、一勞永逸了嗎？

今天我想和大家聊的這本《簡單統計學》，探討的就是這個問題。

簡單統計學

01 故意用錯統計學

在美國和英國這樣的發達國家，疫苗的接種率很低，遠遠沒有一些小國、窮國的接種率高，例如窮國斯里蘭卡的接種率就要比美國和英國高。

那英國和美國的家長，為什麼不願意讓自家的孩子接種疫苗呢？他們難道不知道接種疫苗的好處嗎？

要查找原因，還得從1998年的一篇文章開始說起。

文章一出來，輿論頓時譁然，很多家長非常焦慮，畢竟自閉症比感染麻腮風的危害要大。

於是，他們停止了正常的接種程序，不再給孩子接種疫苗。

事情並沒有完，有人試圖複製韋克菲爾德的研究結果，但不論怎麼努力，始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

也就是說，韋克菲爾德使用了錯誤的數據，最終得出錯誤的結論。

那麼他為什麼要這樣做呢？

2010年，《柳葉刀》雜誌撤銷了韋克菲爾德的文章，同時英國醫學會弔銷了他的行醫執照。

真相得以大白，但影響卻並沒有就此停止，因為這篇文章的緣故，英國的麻疹接種率從92%跌至不到80%，麻疹並也從1998年的56例，增加到2008年的1348例。

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說，最喜歡的數字是0.05，而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗，簡單來理解，顯著性檢驗就是看兩組不同的數據，是否存在差異。

例如，小王為了減肥，服用了某公司的減肥產品，服用減肥產品前後小王的體重見下表。

小王減肥前後數據

乍一看，減肥前平均體重是56千克，減肥後平均體重是55千克，減肥成功，減肥產品有效。

於是，統計學家重新計算，得出一個p值，如果p值小於0.05，那麼小王因為稱重誤差引起的減輕是小概率事件。

也就是說，如果p值小於0.05，那麼小王的體重減輕，是因為減肥產品的作用，不是稱重誤差帶來的，說明減肥成功，具有顯著性效果。

如果p值大於0.05（大概率事件），那麼小王的體重減輕，是因為稱重誤差帶來的，並不是減肥產品的作用，減肥失敗，沒有顯著性效果。

補充一下概率論知識，如果一件事情出現的可能性大於95%（0.95），就是大概率事件，如果小於5%（0.05），就是小概率事件。

經過計算，小王減肥前後體重的p值是0.386，大於0.05，沒有顯著性差異，小王的體重減輕，是因為稱重誤差帶來的，她減肥失敗，沒有顯著性效果。

小王只能哭暈在廁所。

正因為有了顯著性檢驗（0.05），科研人員開始大殺四方。

例如，用澱粉來治療疼痛，通過和原來的止痛藥進行顯著性檢驗，發現p值小於0.05。

結論是：在治療疼痛中，澱粉的作用比原來的止痛藥明顯，於是製藥公司開始瘋狂銷售澱粉。畢竟實驗科學嚴謹，還有數據支持。

每年，製藥公司都會對成百上千的新藥進行顯著性檢驗，即便實驗設計良好，還是會有一些毫無效果的藥物，表現出具有統計顯著性效果。

而這可以給製藥公司帶來源源不斷的利潤。

與之相反的例子是，美國對健康男性實施前列腺癌的普查，在花費了大量的人力物力和財力以後發現，這項普查毫無意義。

普查前後進行顯著性檢驗，p值大於0.05，沒有顯著性差異。

《簡單的統計學》說出了這樣一個事實。

這還是備受尊敬的研究成果，如果是一般的研究成果，能夠複製的比例只會更低。

為此，他還寫了一篇名為“為什麼大多數得到發表的研究結果都是錯誤的”的文章。

雙胞胎有差異嗎？

03 如何識破鄭重其事的胡謅亂道

在《簡單統計學》中，給出了兩個良方來識破鄭重其事的胡謅亂道,他們是常識和新數據。

有人研究認為，如果出生在“火年”，那麼就容易死於心臟病；

如果一個人姓名的首字母縮寫有積極的意義，那麼壽命將延長3-5年；

凌亂的房間會導致種族主義傾向……

這些看上去言之鑿鑿的理論，其實已經違背了常理，這就需要保持足夠的警惕，加里▪史密斯說，很多研究人員用科學的方法，嚴肅的語氣提出了一些愚蠢的理論。

如果你聽到一個新理論覺得非常不可思議，違反了你的常識，那麼就需要警惕了，即便拿出一堆眼花繚亂的數據，也要慎重對待，因為顛覆不同尋常的常識，需要不同尋常的證據。

除了常識之外，還有一個良方是新數據。

我在摸麻將牌的時候，如果用左手的無名指和拇指摸到了一張東風，看到這樣的結果，於是我得出了結論：如果我用左手的無名指和拇指摸牌，那麼，我就可以摸到東風。

如果生活中遇到了問題，你會怎麼辦？

我想大多數人都會去百度一下，所謂內事不決問老婆，外事不決問百度。

但是，百度得來的答案層次不齊，有些更是具有誤導性，2017年魏則西事件就是明證。

對此，有人會去專門的問答平臺找答案，例如知乎和今日頭條的悟空問答，這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識，有些答案事實而非，也缺乏專業性和科學性。

為了解決這個問題，有人會直接閱讀論文，因為論文具有科學性和真實性。

直接百度答案層次不齊，問答平臺事實而非，那麼經過同行評議以後的專業論文，就能夠完全相信、一勞永逸了嗎？

今天我想和大家聊的這本《簡單統計學》，探討的就是這個問題。

簡單統計學

01 故意用錯統計學

在美國和英國這樣的發達國家，疫苗的接種率很低，遠遠沒有一些小國、窮國的接種率高，例如窮國斯里蘭卡的接種率就要比美國和英國高。

那英國和美國的家長，為什麼不願意讓自家的孩子接種疫苗呢？他們難道不知道接種疫苗的好處嗎？

要查找原因，還得從1998年的一篇文章開始說起。

文章一出來，輿論頓時譁然，很多家長非常焦慮，畢竟自閉症比感染麻腮風的危害要大。

於是，他們停止了正常的接種程序，不再給孩子接種疫苗。

事情並沒有完，有人試圖複製韋克菲爾德的研究結果，但不論怎麼努力，始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

也就是說，韋克菲爾德使用了錯誤的數據，最終得出錯誤的結論。

那麼他為什麼要這樣做呢？

2010年，《柳葉刀》雜誌撤銷了韋克菲爾德的文章，同時英國醫學會弔銷了他的行醫執照。

真相得以大白，但影響卻並沒有就此停止，因為這篇文章的緣故，英國的麻疹接種率從92%跌至不到80%，麻疹並也從1998年的56例，增加到2008年的1348例。

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說，最喜歡的數字是0.05，而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗，簡單來理解，顯著性檢驗就是看兩組不同的數據，是否存在差異。

例如，小王為了減肥，服用了某公司的減肥產品，服用減肥產品前後小王的體重見下表。

小王減肥前後數據

乍一看，減肥前平均體重是56千克，減肥後平均體重是55千克，減肥成功，減肥產品有效。

於是，統計學家重新計算，得出一個p值，如果p值小於0.05，那麼小王因為稱重誤差引起的減輕是小概率事件。

也就是說，如果p值小於0.05，那麼小王的體重減輕，是因為減肥產品的作用，不是稱重誤差帶來的，說明減肥成功，具有顯著性效果。

如果p值大於0.05（大概率事件），那麼小王的體重減輕，是因為稱重誤差帶來的，並不是減肥產品的作用，減肥失敗，沒有顯著性效果。

補充一下概率論知識，如果一件事情出現的可能性大於95%（0.95），就是大概率事件，如果小於5%（0.05），就是小概率事件。

經過計算，小王減肥前後體重的p值是0.386，大於0.05，沒有顯著性差異，小王的體重減輕，是因為稱重誤差帶來的，她減肥失敗，沒有顯著性效果。

小王只能哭暈在廁所。

正因為有了顯著性檢驗（0.05），科研人員開始大殺四方。

例如，用澱粉來治療疼痛，通過和原來的止痛藥進行顯著性檢驗，發現p值小於0.05。

結論是：在治療疼痛中，澱粉的作用比原來的止痛藥明顯，於是製藥公司開始瘋狂銷售澱粉。畢竟實驗科學嚴謹，還有數據支持。

每年，製藥公司都會對成百上千的新藥進行顯著性檢驗，即便實驗設計良好，還是會有一些毫無效果的藥物，表現出具有統計顯著性效果。

而這可以給製藥公司帶來源源不斷的利潤。

與之相反的例子是，美國對健康男性實施前列腺癌的普查，在花費了大量的人力物力和財力以後發現，這項普查毫無意義。

普查前後進行顯著性檢驗，p值大於0.05，沒有顯著性差異。

《簡單的統計學》說出了這樣一個事實。

這還是備受尊敬的研究成果，如果是一般的研究成果，能夠複製的比例只會更低。

為此，他還寫了一篇名為“為什麼大多數得到發表的研究結果都是錯誤的”的文章。

雙胞胎有差異嗎？

03 如何識破鄭重其事的胡謅亂道

在《簡單統計學》中，給出了兩個良方來識破鄭重其事的胡謅亂道,他們是常識和新數據。

有人研究認為，如果出生在“火年”，那麼就容易死於心臟病；

如果一個人姓名的首字母縮寫有積極的意義，那麼壽命將延長3-5年；

凌亂的房間會導致種族主義傾向……

除了常識之外，還有一個良方是新數據。

麻將

這並不是空穴來風，而是有數據支持，我之前確實用這樣怪異的姿勢摸到了東風。

很顯然，這樣的理論不僅違背常識，而且還很愚蠢，一副麻將只有4張東風，全部摸完以後是不可能再摸到東風的。

這個時候，最好的辦法就是能夠用新數據進行驗證，複製實驗結果。例如可以用同樣的姿勢再摸一遍，看看結論是否真的如前所說。

這個辦法就是用新數據檢驗理論，得到的結論可能讓人失望，這並不意外。

摸麻將牌的謬論，我們很容易就識別出來，但如果換成另外一種我們不認識的新事物，再加上一些專業的統計學術語，就容易受到迷惑，應該怎麼辦呢？

這時候，就要求我們對一切看上去貌似嚴謹的數據保持警惕，不可盲目信任，然後找其他資料進行比對。

如果，有人用更大規模的樣本複製出相同的結果，那麼這個理論十有八九是正確的，可以接受。

但是，如果沒有人複製出相同的結果，甚至是得出了相反的結論，那麼這個理論大概是錯誤的，需要遠離。

這是一個大數據的時代，言必稱大數據，大數據從來沒有像今天這樣得到過推崇和信任。

誠然，大數據可以為我們做出更明智的決策，發現重要的理論。

但是，有時候大數據也會得出一些荒謬的怪異的理論，而學習一點統計學知識，則可以識別這種愚蠢而又荒誕的理論。

正如著名經濟學家科斯說的，如果你對數據拷打足夠長的時間，它一定會招供。

'《簡單統計學》:被大數據裹挾的現代人，如何識破那些愚蠢的理論'

01 故意用錯統計學

01 故意用錯統計學

02 萬惡的0.05

01 故意用錯統計學

02 萬惡的0.05

01 故意用錯統計學

02 萬惡的0.05

03 如何識破鄭重其事的胡謅亂道

01 故意用錯統計學

02 萬惡的0.05

03 如何識破鄭重其事的胡謅亂道

相關推薦