趣味統計原理 | 01 用一個故事讓你理解什麼是兩類錯誤

1 、噩夢之表相信學過統計學的朋友都有看到過下面的這張表,我把這張表稱為我本科四年期間的“噩夢之表”,原因是我在本科期間對這張表格基本就是靠死記的,從沒有機會去好好地理解這張表格(視頻版見文末~)。

76dbbdc0eb7c9c9a05525cfffa1a615a

我相信國內學習心理學的同學,對這張表格一知半解的同學還有很多。大傢往往不甚清楚:第一類以及第二類錯誤的意義究竟為何?α和β的關系到底是什麼?並且常常覺得在科學研究中,p < .05已近乎成為瞭一個“教條式的”存在。這篇文章將基於美國科恩教授的《心理統計學》(高定國譯)的內容,來生動並且深入地講述假設檢驗及其一系列相關的概念。這本書的英文原版為”Explaining Psychological Statistics”,有興趣的同學也可以拿來讀一讀!

2 、故事背景故事的背景來自於一則真實的新聞,這名同學叫孫浩寧,他是近年的高考狀元之一。令我驚訝的是,他的高考數學獲得瞭滿分!相信對於不少人來說,高中數學可以考到滿分,都是一個接近於傳說的存在。(以下內容純屬虛構)這所孫浩寧所就讀的高中也不例外,校領導一致認為該校出現如此優秀的畢業生,著實歸功於他們獨道的教學方式。所以該校決定一鼓作氣,在新的一年開展數學實驗班,對具有數學天賦的同學進行培優。既然選擇開展實驗班,那麼他們勢必需要開展選拔考試。選拔考試過後,一位面露憨相,數學能力卻驚世駭俗的小王同學脫穎而出。他在此次考試中一舉獲得瞭140分的佳績(滿分為150分)。負責培優選拔的教導主任見狀,不禁眉飛色舞,喜上心頭,當場放話:這個學生是塊好材料,他肯定是個數學天才,這個學生我們要瞭!可這時有一位名叫“零博士”的統計學傢見狀,鄙夷之色頓時溢於言表,他開始對這位位高權重的教導主任大放狠話:此人真是毫無科學素養與懷疑精神,他真是個蠢貨!實際上,零博士認為,這位教導主任是典型的“二極管思維”,根據他的治學經驗,這位小王同學完全有可能是一名“數學庸才”,而不是“數學天才”。據此,二人在對小王的數學能力判斷上,產生瞭極大的分歧:那麼究竟是什麼原因讓這位“零博士”如此勇敢地去頂撞這位“官人”呢?“零博士提出瞭他自己獨道的看法,他說:親愛的教導主任,您怎麼能夠確定這次不是小王打雞血,考得異常好呢?沒準他隻是個數學庸才罷瞭!零博士的看法可謂極其平實瞭!我們似乎並不能說他是吹毛求疵,畢竟,他所說的,恰恰符合瞭我們大多數人的生活經驗。我相信很多數學不好的同學,在求學生涯中,總是因為這樣那樣的原因,有那麼幾次考出瞭極好的成績。那麼我們如何以統計學的方式去回應“零博士”的質疑呢?3 、第一類錯誤在心理學上,有一個著名的假設——正態分佈假設。這個假設認為,我們大多數的心理變量(包括能力、智力以及人格等等)都呈現出正態分佈。放到這一具體的故事情境中,我們可以假設:如果讓小王去參加100次數學考試(這不是在講故事,這在中國高中是完全有可能的),並且小王是個數學庸才的話,他這100次數學考試的成績分佈將會如下圖所示——一個以100分為均數/中心的正態分佈。那麼基於這樣一個分佈,我們可以來看看,作為數學庸才的小王,讓他考出140分甚至更高的數學分數,是一件多難的事情呢?有過一定概率論基礎的同學會知道,正態分佈曲線下的某一區間面積代表瞭這一區間的數學分數出現的概率。那麼參考下圖140分位置右邊的面積,我們可以看到,這一概率僅為2%左右。這時候我們可以根據我們的統計學知識,做下一個斷言:現在我們認為小王他是一個數學天才,而我們這個斷言錯誤(也就是,小王實際上隻是個數學庸才)的概率,僅為2%。這就是第一類錯誤/假陽性錯誤的“故事化闡述”,而這個2%,或者說 .02,實際上就是我們通常在研究報告中所看到的p值。而零博士所持的觀點,無非就是我們天天掛在嘴邊的“零假設”,而教導主任所持的觀點,就是經常提到的“備擇假設”瞭。至此,“零博士”對我們的推論欣慰地笑瞭笑,也提出瞭一樣和我們一樣地結論:4 、第二類錯誤那麼我們如何通過這個故事來生動地理解“第二類錯誤”呢?讓我們來更改一下故事的背景。這次小王的運氣和實力似乎都欠佳,他在這次數學選拔考試中獲得瞭120分,即使他和他的媽媽都很滿意。可是挑剔的教導主任可不希望自己的培優班中出現具有如此瑕疵的“劣等品”。自此,教導主任痛下斷言:這名同學太蠢瞭!他是個數學庸才,我們不要他!我們的“零博士”雖然樂於挑刺,但他更樂於鼓勵同學,是“快樂教育”方式的忠實擁躉。見到此番情形的他,又面露鄙夷之色,再次對教導主任放出狠話:此人果真毫無科學素養與懷疑精神,他無疑確實真的個蠢貨!這時候我們可以看到,在這個故事背景下,“零博士”和教導主任的觀點產生瞭對調。而“零博士”這次又為自己的新觀點——小王是個數學天才找到瞭新的論據,他說:親愛的教導主任,您怎麼能夠排除這次不是小王發揮失常,考得差瞭呢?他完全有可能是個數學天才啊!還是一樣的配方,還是熟悉的味道!那麼這次,我們該如何再次用“零博士”喜歡的統計學方式,去回應他的靈魂拷問呢?我們可以看到,這是熟悉的“數學庸才”的正態分佈,在正態分佈的基礎上,我們又添加瞭一個淡藍色的“數學天才”的正態分佈,這一正態分佈是我們假想的,我們並不能夠確定它均數所落到的具體位置,但是我們清楚,它的形狀和“數學庸才”的近似,並且落在右邊。讓我們來看一下,120分大概在橫軸上的什麼位置:據此,我們可以問一下自己,對於一名我們假想的數學天才來說,發揮失常從而考到一個120分及以下的分數,從概率的角度來說,它究竟是一件尋常還是不尋常的事情呢?我們可以看一下在“天才分佈”中,120分及以下所對應的面積,從圖中可以看到,這一部分所對應的面積/概率還是很大的。這一概率也就是我們通常意義上所講的“第二類錯誤”,在我們的故事中,也就是:當我們認為小王是個數學庸才時,我們的判斷錯誤(也就是,小王是個數學天才,但他發揮失常)的情況。針對這一情況,“零博士”建議我們,雖然我們沒有辦法認定小王是個數學天才,但也不要輕易地接受小王是個數學庸才的假設。他給瞭我們一種極佳的說辭:親愛的教導主任,我認為,我們目前還不能拒絕小王是個數學庸才(也就是零假設)這一事實。(We cannot reject null hypothesis)5 、α和β的關系講到這裡,我們實際上已經通過一個具體的故事,將“第一類錯誤”與“第二類錯誤”講明白瞭。這個時候,我們結合一下先前用到的正態分佈圖,再來審視一下所謂的“α+β≠1”這條在各大教材教輔中的屢見不鮮的定理,大概就不足為奇瞭!我們可以清楚地看到,α所對應的概率/面積,與β所對應的概率/面積之和,明顯不太可能直接對應整個正態分佈下的面積。同時,先前提到過,這一“天才分佈”(備擇假設分佈)僅僅是我們假想的,它的位置完全有可能再往左邊,或是右邊移動一些。這也就是為什麼我們說α和β之間的關系是不確定的,它並不等於1。6 、為什麼科學研究如此熱衷於p值的使用看到這裡,倘若大傢對於上述的故事,以及故事中的統計學概念,有瞭比較好的理解的話,應該大致會對科學研究中的“假設檢驗”產生一些新的理解與感悟。實際上,p < .05它絕不是一個科學研究中“教條式的”存在,它更像是一群深受概率統計世界觀影響的成年人之間的理性約定。p值不僅告訴瞭我們對於自己的推斷可以抱以多大的確定性,更告訴瞭我們要對這一結論持有多大程度的懷疑(也就是,即使小王考得那麼好,他也有2%的概率隻是個數學庸才)——在統計學的世界裡,所有的事情都不是非黑即白的,當我們做下某一種結論時,我們要清楚也存在著另一種結論(小概率事件)發生的可能性。我們通篇提到的這位富於懷疑與抗爭精神的“零博士”,實際上就是現代統計學奠基人之一的Ronald Fisher教授。相信大傢或多或少都聽聞過他的last name,他為現代統計假設檢驗的思路的確立,貢獻瞭自己大半輩子的時光。在我看來,這一思路著實是一個瞭不起的成就。也希望作為後人的我們,在學習這個極為基礎的思路時,能夠更加耐心地去體味其中的意蘊,同時也為我們的統計學打下紮實的基礎!作者:楊鵬遠排版:張旭嬋

重磅|20萬字英文學術寫作文庫筆記正式發佈(90元 後臺發送支付截圖+接收郵箱即可)

发表回复

相关推荐

2023年投影儀推薦選購攻略、避坑攻略,最全面攻略 | 小米、明基、愛普生、堅果、極米、大眼橙、傢用客廳臥室投影儀、高清、4K 投影儀推薦

前文概要結論先行(左邊標粗為推薦款):年度最新款/熱賣款投影儀介紹區體驗檔(2000~3000)極米NEW Z6X在同價位裡,性能表現...

· 2分钟前

婚姻輔導是什麼東西?婚姻問題找婚姻傢庭咨詢師真的有用嗎?

[婚姻輔導是什麼東西?]“婚姻輔導” 這四個字,聽瞭就好像感覺要出問題瞭!其實恰恰相反 它會幫助你減少許多問題。有些人會...

· 2分钟前

落地签也会被拒签?!

现今不少国家都对我国开放了落地签, 本来是一个便利的政策, 一般情况下都能顺利办下来 但是有些小细节不注意也会面临被拒 ...

· 4分钟前

【零基礎芯片課】Day 37 聊聊芯片工程師這個職業

半導體是一個人才、資金、技術密集型的行業,從工作環境、待遇、成長空間角度看比較適合理工科作為工程師的職業優選行業之一...

· 5分钟前

最新28套高质量期末家长会&期末颁奖典礼&期末表彰大会PPT模板!

大家好,我是鱼主任,今天给大家带来最新28套高质量期末家长会&期末颁奖典礼&期末表彰大会PPT模板!

· 6分钟前