'《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論'

"

如果生活中遇到了問題,你會怎麼辦?

我想大多數人都會去百度一下,所謂內事不決問老婆,外事不決問百度。

但是,百度得來的答案層次不齊,有些更是具有誤導性,2017年魏則西事件就是明證。

對此,有人會去專門的問答平臺找答案,例如知乎和今日頭條的悟空問答,這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識,有些答案事實而非,也缺乏專業性和科學性。

為了解決這個問題,有人會直接閱讀論文,因為論文具有科學性和真實性。

首先論文的作者,是具有一定造詣的專業人士;其次,論文有大量的數據作為基礎;最後,論文的發表需要雜誌社進行層層審核(同行評議),綜合下來,論文的內容是最值得信賴的。

直接百度答案層次不齊,問答平臺事實而非,那麼經過同行評議以後的專業論文,就能夠完全相信、一勞永逸了嗎?

今天我想和大家聊的這本《簡單統計學》,探討的就是這個問題。

"

如果生活中遇到了問題,你會怎麼辦?

我想大多數人都會去百度一下,所謂內事不決問老婆,外事不決問百度。

但是,百度得來的答案層次不齊,有些更是具有誤導性,2017年魏則西事件就是明證。

對此,有人會去專門的問答平臺找答案,例如知乎和今日頭條的悟空問答,這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識,有些答案事實而非,也缺乏專業性和科學性。

為了解決這個問題,有人會直接閱讀論文,因為論文具有科學性和真實性。

首先論文的作者,是具有一定造詣的專業人士;其次,論文有大量的數據作為基礎;最後,論文的發表需要雜誌社進行層層審核(同行評議),綜合下來,論文的內容是最值得信賴的。

直接百度答案層次不齊,問答平臺事實而非,那麼經過同行評議以後的專業論文,就能夠完全相信、一勞永逸了嗎?

今天我想和大家聊的這本《簡單統計學》,探討的就是這個問題。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

簡單統計學

它的作者是耶魯大學的統計學博士加里▪史密斯,他認為有些人誤用了統計學,得出了錯誤的結論;有些則故意錯誤使用統計學,得出了自己想要的結論,而這些結論都偏離事實。

01 故意用錯統計學

在美國和英國這樣的發達國家,疫苗的接種率很低,遠遠沒有一些小國、窮國的接種率高,例如窮國斯里蘭卡的接種率就要比美國和英國高。

現代醫學發展到今天,我們都知道,接種疫苗是預防疾病最有效的方式之一,天花之所以能被消滅,就是因為疫苗的功勞,而HIV之所以猖獗,最根本原因就在於目前還沒有HIV疫苗。

那英國和美國的家長,為什麼不願意讓自家的孩子接種疫苗呢?他們難道不知道接種疫苗的好處嗎?

要查找原因,還得從1998年的一篇文章開始說起。

那一年,英國醫生韋克菲爾德和他的合作者一起,在著名的醫學雜誌《柳葉刀》上發表了一篇論文,論文的結論是:12名正常兒童在接種麻疹、腮腺炎和風疹疫苗以後,患上了自閉症。

文章一出來,輿論頓時譁然,很多家長非常焦慮,畢竟自閉症比感染麻腮風的危害要大。

於是,他們停止了正常的接種程序,不再給孩子接種疫苗。

事情並沒有完,有人試圖複製韋克菲爾德的研究結果,但不論怎麼努力,始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

為此,一位名為賴恩▪迪爾的記者開展了調查,調查的結果是,韋克菲爾德使用的數據與英國官方的數據不符,並且韋克菲爾德聲稱患上自閉症的12名兒童中,只有1人確診患有自閉症,其他11人都是健康的。

也就是說,韋克菲爾德使用了錯誤的數據,最終得出錯誤的結論。

那麼他為什麼要這樣做呢?

賴恩▪迪爾進一步調查發現,韋克菲爾德計劃推出替代性疫苗,他認為,新疫苗才是安全的,與此同時,韋克菲爾德也與律師合作,希望對疫苗生產商提起訴訟,從而獲得豐厚的回報。

2010年,《柳葉刀》雜誌撤銷了韋克菲爾德的文章,同時英國醫學會弔銷了他的行醫執照。

真相得以大白,但影響卻並沒有就此停止,因為這篇文章的緣故,英國的麻疹接種率從92%跌至不到80%,麻疹並也從1998年的56例,增加到2008年的1348例。

"

如果生活中遇到了問題,你會怎麼辦?

我想大多數人都會去百度一下,所謂內事不決問老婆,外事不決問百度。

但是,百度得來的答案層次不齊,有些更是具有誤導性,2017年魏則西事件就是明證。

對此,有人會去專門的問答平臺找答案,例如知乎和今日頭條的悟空問答,這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識,有些答案事實而非,也缺乏專業性和科學性。

為了解決這個問題,有人會直接閱讀論文,因為論文具有科學性和真實性。

首先論文的作者,是具有一定造詣的專業人士;其次,論文有大量的數據作為基礎;最後,論文的發表需要雜誌社進行層層審核(同行評議),綜合下來,論文的內容是最值得信賴的。

直接百度答案層次不齊,問答平臺事實而非,那麼經過同行評議以後的專業論文,就能夠完全相信、一勞永逸了嗎?

今天我想和大家聊的這本《簡單統計學》,探討的就是這個問題。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

簡單統計學

它的作者是耶魯大學的統計學博士加里▪史密斯,他認為有些人誤用了統計學,得出了錯誤的結論;有些則故意錯誤使用統計學,得出了自己想要的結論,而這些結論都偏離事實。

01 故意用錯統計學

在美國和英國這樣的發達國家,疫苗的接種率很低,遠遠沒有一些小國、窮國的接種率高,例如窮國斯里蘭卡的接種率就要比美國和英國高。

現代醫學發展到今天,我們都知道,接種疫苗是預防疾病最有效的方式之一,天花之所以能被消滅,就是因為疫苗的功勞,而HIV之所以猖獗,最根本原因就在於目前還沒有HIV疫苗。

那英國和美國的家長,為什麼不願意讓自家的孩子接種疫苗呢?他們難道不知道接種疫苗的好處嗎?

要查找原因,還得從1998年的一篇文章開始說起。

那一年,英國醫生韋克菲爾德和他的合作者一起,在著名的醫學雜誌《柳葉刀》上發表了一篇論文,論文的結論是:12名正常兒童在接種麻疹、腮腺炎和風疹疫苗以後,患上了自閉症。

文章一出來,輿論頓時譁然,很多家長非常焦慮,畢竟自閉症比感染麻腮風的危害要大。

於是,他們停止了正常的接種程序,不再給孩子接種疫苗。

事情並沒有完,有人試圖複製韋克菲爾德的研究結果,但不論怎麼努力,始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

為此,一位名為賴恩▪迪爾的記者開展了調查,調查的結果是,韋克菲爾德使用的數據與英國官方的數據不符,並且韋克菲爾德聲稱患上自閉症的12名兒童中,只有1人確診患有自閉症,其他11人都是健康的。

也就是說,韋克菲爾德使用了錯誤的數據,最終得出錯誤的結論。

那麼他為什麼要這樣做呢?

賴恩▪迪爾進一步調查發現,韋克菲爾德計劃推出替代性疫苗,他認為,新疫苗才是安全的,與此同時,韋克菲爾德也與律師合作,希望對疫苗生產商提起訴訟,從而獲得豐厚的回報。

2010年,《柳葉刀》雜誌撤銷了韋克菲爾德的文章,同時英國醫學會弔銷了他的行醫執照。

真相得以大白,但影響卻並沒有就此停止,因為這篇文章的緣故,英國的麻疹接種率從92%跌至不到80%,麻疹並也從1998年的56例,增加到2008年的1348例。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說,最喜歡的數字是0.05,而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗,簡單來理解,顯著性檢驗就是看兩組不同的數據,是否存在差異。

例如,小王為了減肥,服用了某公司的減肥產品,服用減肥產品前後小王的體重見下表。

"

如果生活中遇到了問題,你會怎麼辦?

我想大多數人都會去百度一下,所謂內事不決問老婆,外事不決問百度。

但是,百度得來的答案層次不齊,有些更是具有誤導性,2017年魏則西事件就是明證。

對此,有人會去專門的問答平臺找答案,例如知乎和今日頭條的悟空問答,這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識,有些答案事實而非,也缺乏專業性和科學性。

為了解決這個問題,有人會直接閱讀論文,因為論文具有科學性和真實性。

首先論文的作者,是具有一定造詣的專業人士;其次,論文有大量的數據作為基礎;最後,論文的發表需要雜誌社進行層層審核(同行評議),綜合下來,論文的內容是最值得信賴的。

直接百度答案層次不齊,問答平臺事實而非,那麼經過同行評議以後的專業論文,就能夠完全相信、一勞永逸了嗎?

今天我想和大家聊的這本《簡單統計學》,探討的就是這個問題。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

簡單統計學

它的作者是耶魯大學的統計學博士加里▪史密斯,他認為有些人誤用了統計學,得出了錯誤的結論;有些則故意錯誤使用統計學,得出了自己想要的結論,而這些結論都偏離事實。

01 故意用錯統計學

在美國和英國這樣的發達國家,疫苗的接種率很低,遠遠沒有一些小國、窮國的接種率高,例如窮國斯里蘭卡的接種率就要比美國和英國高。

現代醫學發展到今天,我們都知道,接種疫苗是預防疾病最有效的方式之一,天花之所以能被消滅,就是因為疫苗的功勞,而HIV之所以猖獗,最根本原因就在於目前還沒有HIV疫苗。

那英國和美國的家長,為什麼不願意讓自家的孩子接種疫苗呢?他們難道不知道接種疫苗的好處嗎?

要查找原因,還得從1998年的一篇文章開始說起。

那一年,英國醫生韋克菲爾德和他的合作者一起,在著名的醫學雜誌《柳葉刀》上發表了一篇論文,論文的結論是:12名正常兒童在接種麻疹、腮腺炎和風疹疫苗以後,患上了自閉症。

文章一出來,輿論頓時譁然,很多家長非常焦慮,畢竟自閉症比感染麻腮風的危害要大。

於是,他們停止了正常的接種程序,不再給孩子接種疫苗。

事情並沒有完,有人試圖複製韋克菲爾德的研究結果,但不論怎麼努力,始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

為此,一位名為賴恩▪迪爾的記者開展了調查,調查的結果是,韋克菲爾德使用的數據與英國官方的數據不符,並且韋克菲爾德聲稱患上自閉症的12名兒童中,只有1人確診患有自閉症,其他11人都是健康的。

也就是說,韋克菲爾德使用了錯誤的數據,最終得出錯誤的結論。

那麼他為什麼要這樣做呢?

賴恩▪迪爾進一步調查發現,韋克菲爾德計劃推出替代性疫苗,他認為,新疫苗才是安全的,與此同時,韋克菲爾德也與律師合作,希望對疫苗生產商提起訴訟,從而獲得豐厚的回報。

2010年,《柳葉刀》雜誌撤銷了韋克菲爾德的文章,同時英國醫學會弔銷了他的行醫執照。

真相得以大白,但影響卻並沒有就此停止,因為這篇文章的緣故,英國的麻疹接種率從92%跌至不到80%,麻疹並也從1998年的56例,增加到2008年的1348例。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說,最喜歡的數字是0.05,而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗,簡單來理解,顯著性檢驗就是看兩組不同的數據,是否存在差異。

例如,小王為了減肥,服用了某公司的減肥產品,服用減肥產品前後小王的體重見下表。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

小王減肥前後數據

乍一看,減肥前平均體重是56千克,減肥後平均體重是55千克,減肥成功,減肥產品有效。

這個時候,統計學家跳出來說,不能這樣簡單粗暴的比,因為在稱重的時候會產生誤差(就是真實值和稱重值之間的差),這1千克,到底是減肥產品的作用,還是因為稱重誤差帶來的減輕,誰也不知道,必須經過統計學計算才行。

於是,統計學家重新計算,得出一個p值,如果p值小於0.05,那麼小王因為稱重誤差引起的減輕是小概率事件。

也就是說,如果p值小於0.05,那麼小王的體重減輕,是因為減肥產品的作用,不是稱重誤差帶來的,說明減肥成功,具有顯著性效果。

如果p值大於0.05(大概率事件),那麼小王的體重減輕,是因為稱重誤差帶來的,並不是減肥產品的作用,減肥失敗,沒有顯著性效果。

補充一下概率論知識,如果一件事情出現的可能性大於95%(0.95),就是大概率事件,如果小於5%(0.05),就是小概率事件。

經過計算,小王減肥前後體重的p值是0.386,大於0.05,沒有顯著性差異,小王的體重減輕,是因為稱重誤差帶來的,她減肥失敗,沒有顯著性效果。

小王只能哭暈在廁所。

正因為有了顯著性檢驗(0.05),科研人員開始大殺四方。

例如,用澱粉來治療疼痛,通過和原來的止痛藥進行顯著性檢驗,發現p值小於0.05。

結論是:在治療疼痛中,澱粉的作用比原來的止痛藥明顯,於是製藥公司開始瘋狂銷售澱粉。畢竟實驗科學嚴謹,還有數據支持。

每年,製藥公司都會對成百上千的新藥進行顯著性檢驗,即便實驗設計良好,還是會有一些毫無效果的藥物,表現出具有統計顯著性效果。

而這可以給製藥公司帶來源源不斷的利潤。

與之相反的例子是,美國對健康男性實施前列腺癌的普查,在花費了大量的人力物力和財力以後發現,這項普查毫無意義。

普查前後進行顯著性檢驗,p值大於0.05,沒有顯著性差異。

《簡單的統計學》說出了這樣一個事實。

一位名叫約翰▪約安尼季斯的醫生,針對45項備受尊敬的醫學研究發現,只有20項被人用更大規模的樣本進行了檢驗,複製出當時的研究結果,複製成功的比例是44%。

這還是備受尊敬的研究成果,如果是一般的研究成果,能夠複製的比例只會更低。

為此,他還寫了一篇名為“為什麼大多數得到發表的研究結果都是錯誤的”的文章。

"

如果生活中遇到了問題,你會怎麼辦?

我想大多數人都會去百度一下,所謂內事不決問老婆,外事不決問百度。

但是,百度得來的答案層次不齊,有些更是具有誤導性,2017年魏則西事件就是明證。

對此,有人會去專門的問答平臺找答案,例如知乎和今日頭條的悟空問答,這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識,有些答案事實而非,也缺乏專業性和科學性。

為了解決這個問題,有人會直接閱讀論文,因為論文具有科學性和真實性。

首先論文的作者,是具有一定造詣的專業人士;其次,論文有大量的數據作為基礎;最後,論文的發表需要雜誌社進行層層審核(同行評議),綜合下來,論文的內容是最值得信賴的。

直接百度答案層次不齊,問答平臺事實而非,那麼經過同行評議以後的專業論文,就能夠完全相信、一勞永逸了嗎?

今天我想和大家聊的這本《簡單統計學》,探討的就是這個問題。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

簡單統計學

它的作者是耶魯大學的統計學博士加里▪史密斯,他認為有些人誤用了統計學,得出了錯誤的結論;有些則故意錯誤使用統計學,得出了自己想要的結論,而這些結論都偏離事實。

01 故意用錯統計學

在美國和英國這樣的發達國家,疫苗的接種率很低,遠遠沒有一些小國、窮國的接種率高,例如窮國斯里蘭卡的接種率就要比美國和英國高。

現代醫學發展到今天,我們都知道,接種疫苗是預防疾病最有效的方式之一,天花之所以能被消滅,就是因為疫苗的功勞,而HIV之所以猖獗,最根本原因就在於目前還沒有HIV疫苗。

那英國和美國的家長,為什麼不願意讓自家的孩子接種疫苗呢?他們難道不知道接種疫苗的好處嗎?

要查找原因,還得從1998年的一篇文章開始說起。

那一年,英國醫生韋克菲爾德和他的合作者一起,在著名的醫學雜誌《柳葉刀》上發表了一篇論文,論文的結論是:12名正常兒童在接種麻疹、腮腺炎和風疹疫苗以後,患上了自閉症。

文章一出來,輿論頓時譁然,很多家長非常焦慮,畢竟自閉症比感染麻腮風的危害要大。

於是,他們停止了正常的接種程序,不再給孩子接種疫苗。

事情並沒有完,有人試圖複製韋克菲爾德的研究結果,但不論怎麼努力,始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

為此,一位名為賴恩▪迪爾的記者開展了調查,調查的結果是,韋克菲爾德使用的數據與英國官方的數據不符,並且韋克菲爾德聲稱患上自閉症的12名兒童中,只有1人確診患有自閉症,其他11人都是健康的。

也就是說,韋克菲爾德使用了錯誤的數據,最終得出錯誤的結論。

那麼他為什麼要這樣做呢?

賴恩▪迪爾進一步調查發現,韋克菲爾德計劃推出替代性疫苗,他認為,新疫苗才是安全的,與此同時,韋克菲爾德也與律師合作,希望對疫苗生產商提起訴訟,從而獲得豐厚的回報。

2010年,《柳葉刀》雜誌撤銷了韋克菲爾德的文章,同時英國醫學會弔銷了他的行醫執照。

真相得以大白,但影響卻並沒有就此停止,因為這篇文章的緣故,英國的麻疹接種率從92%跌至不到80%,麻疹並也從1998年的56例,增加到2008年的1348例。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說,最喜歡的數字是0.05,而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗,簡單來理解,顯著性檢驗就是看兩組不同的數據,是否存在差異。

例如,小王為了減肥,服用了某公司的減肥產品,服用減肥產品前後小王的體重見下表。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

小王減肥前後數據

乍一看,減肥前平均體重是56千克,減肥後平均體重是55千克,減肥成功,減肥產品有效。

這個時候,統計學家跳出來說,不能這樣簡單粗暴的比,因為在稱重的時候會產生誤差(就是真實值和稱重值之間的差),這1千克,到底是減肥產品的作用,還是因為稱重誤差帶來的減輕,誰也不知道,必須經過統計學計算才行。

於是,統計學家重新計算,得出一個p值,如果p值小於0.05,那麼小王因為稱重誤差引起的減輕是小概率事件。

也就是說,如果p值小於0.05,那麼小王的體重減輕,是因為減肥產品的作用,不是稱重誤差帶來的,說明減肥成功,具有顯著性效果。

如果p值大於0.05(大概率事件),那麼小王的體重減輕,是因為稱重誤差帶來的,並不是減肥產品的作用,減肥失敗,沒有顯著性效果。

補充一下概率論知識,如果一件事情出現的可能性大於95%(0.95),就是大概率事件,如果小於5%(0.05),就是小概率事件。

經過計算,小王減肥前後體重的p值是0.386,大於0.05,沒有顯著性差異,小王的體重減輕,是因為稱重誤差帶來的,她減肥失敗,沒有顯著性效果。

小王只能哭暈在廁所。

正因為有了顯著性檢驗(0.05),科研人員開始大殺四方。

例如,用澱粉來治療疼痛,通過和原來的止痛藥進行顯著性檢驗,發現p值小於0.05。

結論是:在治療疼痛中,澱粉的作用比原來的止痛藥明顯,於是製藥公司開始瘋狂銷售澱粉。畢竟實驗科學嚴謹,還有數據支持。

每年,製藥公司都會對成百上千的新藥進行顯著性檢驗,即便實驗設計良好,還是會有一些毫無效果的藥物,表現出具有統計顯著性效果。

而這可以給製藥公司帶來源源不斷的利潤。

與之相反的例子是,美國對健康男性實施前列腺癌的普查,在花費了大量的人力物力和財力以後發現,這項普查毫無意義。

普查前後進行顯著性檢驗,p值大於0.05,沒有顯著性差異。

《簡單的統計學》說出了這樣一個事實。

一位名叫約翰▪約安尼季斯的醫生,針對45項備受尊敬的醫學研究發現,只有20項被人用更大規模的樣本進行了檢驗,複製出當時的研究結果,複製成功的比例是44%。

這還是備受尊敬的研究成果,如果是一般的研究成果,能夠複製的比例只會更低。

為此,他還寫了一篇名為“為什麼大多數得到發表的研究結果都是錯誤的”的文章。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

雙胞胎有差異嗎?

03 如何識破鄭重其事的胡謅亂道

在《簡單統計學》中,給出了兩個良方來識破鄭重其事的胡謅亂道,他們是常識和新數據。

有人研究認為,如果出生在“火年”,那麼就容易死於心臟病;

如果一個人姓名的首字母縮寫有積極的意義,那麼壽命將延長3-5年;

凌亂的房間會導致種族主義傾向……

這些看上去言之鑿鑿的理論,其實已經違背了常理,這就需要保持足夠的警惕,加里▪史密斯說,很多研究人員用科學的方法,嚴肅的語氣提出了一些愚蠢的理論。

如果你聽到一個新理論覺得非常不可思議,違反了你的常識,那麼就需要警惕了,即便拿出一堆眼花繚亂的數據,也要慎重對待,因為顛覆不同尋常的常識,需要不同尋常的證據。

除了常識之外,還有一個良方是新數據。

我在摸麻將牌的時候,如果用左手的無名指和拇指摸到了一張東風,看到這樣的結果,於是我得出了結論:如果我用左手的無名指和拇指摸牌,那麼,我就可以摸到東風。

"

如果生活中遇到了問題,你會怎麼辦?

我想大多數人都會去百度一下,所謂內事不決問老婆,外事不決問百度。

但是,百度得來的答案層次不齊,有些更是具有誤導性,2017年魏則西事件就是明證。

對此,有人會去專門的問答平臺找答案,例如知乎和今日頭條的悟空問答,這些平臺的答案要比直接百度出來的靠譜得多。

但問答平臺通常都是二手知識,有些答案事實而非,也缺乏專業性和科學性。

為了解決這個問題,有人會直接閱讀論文,因為論文具有科學性和真實性。

首先論文的作者,是具有一定造詣的專業人士;其次,論文有大量的數據作為基礎;最後,論文的發表需要雜誌社進行層層審核(同行評議),綜合下來,論文的內容是最值得信賴的。

直接百度答案層次不齊,問答平臺事實而非,那麼經過同行評議以後的專業論文,就能夠完全相信、一勞永逸了嗎?

今天我想和大家聊的這本《簡單統計學》,探討的就是這個問題。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

簡單統計學

它的作者是耶魯大學的統計學博士加里▪史密斯,他認為有些人誤用了統計學,得出了錯誤的結論;有些則故意錯誤使用統計學,得出了自己想要的結論,而這些結論都偏離事實。

01 故意用錯統計學

在美國和英國這樣的發達國家,疫苗的接種率很低,遠遠沒有一些小國、窮國的接種率高,例如窮國斯里蘭卡的接種率就要比美國和英國高。

現代醫學發展到今天,我們都知道,接種疫苗是預防疾病最有效的方式之一,天花之所以能被消滅,就是因為疫苗的功勞,而HIV之所以猖獗,最根本原因就在於目前還沒有HIV疫苗。

那英國和美國的家長,為什麼不願意讓自家的孩子接種疫苗呢?他們難道不知道接種疫苗的好處嗎?

要查找原因,還得從1998年的一篇文章開始說起。

那一年,英國醫生韋克菲爾德和他的合作者一起,在著名的醫學雜誌《柳葉刀》上發表了一篇論文,論文的結論是:12名正常兒童在接種麻疹、腮腺炎和風疹疫苗以後,患上了自閉症。

文章一出來,輿論頓時譁然,很多家長非常焦慮,畢竟自閉症比感染麻腮風的危害要大。

於是,他們停止了正常的接種程序,不再給孩子接種疫苗。

事情並沒有完,有人試圖複製韋克菲爾德的研究結果,但不論怎麼努力,始終得不到接種麻疹、腮腺炎和風疹疫苗後患上了自閉症的結論。

為此,一位名為賴恩▪迪爾的記者開展了調查,調查的結果是,韋克菲爾德使用的數據與英國官方的數據不符,並且韋克菲爾德聲稱患上自閉症的12名兒童中,只有1人確診患有自閉症,其他11人都是健康的。

也就是說,韋克菲爾德使用了錯誤的數據,最終得出錯誤的結論。

那麼他為什麼要這樣做呢?

賴恩▪迪爾進一步調查發現,韋克菲爾德計劃推出替代性疫苗,他認為,新疫苗才是安全的,與此同時,韋克菲爾德也與律師合作,希望對疫苗生產商提起訴訟,從而獲得豐厚的回報。

2010年,《柳葉刀》雜誌撤銷了韋克菲爾德的文章,同時英國醫學會弔銷了他的行醫執照。

真相得以大白,但影響卻並沒有就此停止,因為這篇文章的緣故,英國的麻疹接種率從92%跌至不到80%,麻疹並也從1998年的56例,增加到2008年的1348例。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

疫苗接種

02 萬惡的0.05

對於一名科研工作者來說,最喜歡的數字是0.05,而最害怕的數字可能也是0.05。

對應0.05的是一個具有魔幻性的統計學術語——顯著性檢驗,簡單來理解,顯著性檢驗就是看兩組不同的數據,是否存在差異。

例如,小王為了減肥,服用了某公司的減肥產品,服用減肥產品前後小王的體重見下表。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

小王減肥前後數據

乍一看,減肥前平均體重是56千克,減肥後平均體重是55千克,減肥成功,減肥產品有效。

這個時候,統計學家跳出來說,不能這樣簡單粗暴的比,因為在稱重的時候會產生誤差(就是真實值和稱重值之間的差),這1千克,到底是減肥產品的作用,還是因為稱重誤差帶來的減輕,誰也不知道,必須經過統計學計算才行。

於是,統計學家重新計算,得出一個p值,如果p值小於0.05,那麼小王因為稱重誤差引起的減輕是小概率事件。

也就是說,如果p值小於0.05,那麼小王的體重減輕,是因為減肥產品的作用,不是稱重誤差帶來的,說明減肥成功,具有顯著性效果。

如果p值大於0.05(大概率事件),那麼小王的體重減輕,是因為稱重誤差帶來的,並不是減肥產品的作用,減肥失敗,沒有顯著性效果。

補充一下概率論知識,如果一件事情出現的可能性大於95%(0.95),就是大概率事件,如果小於5%(0.05),就是小概率事件。

經過計算,小王減肥前後體重的p值是0.386,大於0.05,沒有顯著性差異,小王的體重減輕,是因為稱重誤差帶來的,她減肥失敗,沒有顯著性效果。

小王只能哭暈在廁所。

正因為有了顯著性檢驗(0.05),科研人員開始大殺四方。

例如,用澱粉來治療疼痛,通過和原來的止痛藥進行顯著性檢驗,發現p值小於0.05。

結論是:在治療疼痛中,澱粉的作用比原來的止痛藥明顯,於是製藥公司開始瘋狂銷售澱粉。畢竟實驗科學嚴謹,還有數據支持。

每年,製藥公司都會對成百上千的新藥進行顯著性檢驗,即便實驗設計良好,還是會有一些毫無效果的藥物,表現出具有統計顯著性效果。

而這可以給製藥公司帶來源源不斷的利潤。

與之相反的例子是,美國對健康男性實施前列腺癌的普查,在花費了大量的人力物力和財力以後發現,這項普查毫無意義。

普查前後進行顯著性檢驗,p值大於0.05,沒有顯著性差異。

《簡單的統計學》說出了這樣一個事實。

一位名叫約翰▪約安尼季斯的醫生,針對45項備受尊敬的醫學研究發現,只有20項被人用更大規模的樣本進行了檢驗,複製出當時的研究結果,複製成功的比例是44%。

這還是備受尊敬的研究成果,如果是一般的研究成果,能夠複製的比例只會更低。

為此,他還寫了一篇名為“為什麼大多數得到發表的研究結果都是錯誤的”的文章。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

雙胞胎有差異嗎?

03 如何識破鄭重其事的胡謅亂道

在《簡單統計學》中,給出了兩個良方來識破鄭重其事的胡謅亂道,他們是常識和新數據。

有人研究認為,如果出生在“火年”,那麼就容易死於心臟病;

如果一個人姓名的首字母縮寫有積極的意義,那麼壽命將延長3-5年;

凌亂的房間會導致種族主義傾向……

這些看上去言之鑿鑿的理論,其實已經違背了常理,這就需要保持足夠的警惕,加里▪史密斯說,很多研究人員用科學的方法,嚴肅的語氣提出了一些愚蠢的理論。

如果你聽到一個新理論覺得非常不可思議,違反了你的常識,那麼就需要警惕了,即便拿出一堆眼花繚亂的數據,也要慎重對待,因為顛覆不同尋常的常識,需要不同尋常的證據。

除了常識之外,還有一個良方是新數據。

我在摸麻將牌的時候,如果用左手的無名指和拇指摸到了一張東風,看到這樣的結果,於是我得出了結論:如果我用左手的無名指和拇指摸牌,那麼,我就可以摸到東風。

《簡單統計學》:被大數據裹挾的現代人,如何識破那些愚蠢的理論

麻將

這並不是空穴來風,而是有數據支持,我之前確實用這樣怪異的姿勢摸到了東風。

很顯然,這樣的理論不僅違背常識,而且還很愚蠢,一副麻將只有4張東風,全部摸完以後是不可能再摸到東風的。

這個時候,最好的辦法就是能夠用新數據進行驗證,複製實驗結果。例如可以用同樣的姿勢再摸一遍,看看結論是否真的如前所說。

這個辦法就是用新數據檢驗理論,得到的結論可能讓人失望,這並不意外。

摸麻將牌的謬論,我們很容易就識別出來,但如果換成另外一種我們不認識的新事物,再加上一些專業的統計學術語,就容易受到迷惑,應該怎麼辦呢?

這時候,就要求我們對一切看上去貌似嚴謹的數據保持警惕,不可盲目信任,然後找其他資料進行比對。

如果,有人用更大規模的樣本複製出相同的結果,那麼這個理論十有八九是正確的,可以接受。

但是,如果沒有人複製出相同的結果,甚至是得出了相反的結論,那麼這個理論大概是錯誤的,需要遠離。

這是一個大數據的時代,言必稱大數據,大數據從來沒有像今天這樣得到過推崇和信任。

誠然,大數據可以為我們做出更明智的決策,發現重要的理論。

但是,有時候大數據也會得出一些荒謬的怪異的理論,而學習一點統計學知識,則可以識別這種愚蠢而又荒誕的理論。

正如著名經濟學家科斯說的,如果你對數據拷打足夠長的時間,它一定會招供。

"

相關推薦

推薦中...