假設檢驗之三:假設檢驗的基本步驟

雖然在具體某種分析方法中假設檢驗的步驟不盡相同,但一些基本的步驟還是差不多的。

在馬逢時老師書中,假設檢驗的基本步驟分五步,我這裡給出的步驟更細一點。

首先還是要祭出前面出現的那張圖:

具體步驟將根據這張圖展開。具體步驟如下:

84e67e58b6b1e0e985bb15258afa2b5e

將實際問題提煉為統計問題

這是很重要的一步,也是關鍵的一步。舉個例子來說明,某工廠對生產線進行瞭技術改造,老板想知道改造後生產線有什麼提升。首先就要搞清楚對比什麼,是加工精度提高瞭?是合格率提高瞭?是加工工時縮短瞭?還是人力節省瞭?等等。如果老板關註產能是不是提升瞭,那麼實際問題就可以提煉成“改造後的每小時產出數是否高於改進前”這樣一個統計問題。當然老板可能不止關註一個問題,那你就需要提煉出多個統計問題,每個問題所采用的推斷方法可能不同。

再舉個例子,如果你是面包房的老板,最近改進瞭配方,你想知道在客戶那裡面包的口味是否變得更好瞭。這時你就要首先考慮如何對口味進行評價,是由客戶打分呢?還是僅僅讓客戶評價一下,然後計數看看客戶的喜好呢?我們搞簡單一點,兩種面包都讓客戶品嘗,然後有多少人喜歡老面包,有多少人喜歡新面包。那這個實際問題就可以提煉成“配方更改後面包口味是否高於更改前”這樣一個統計問題。

建立假設

假設檢驗需要建立一對相互對立的假設,原假設H_{0} 和備擇假設H_{a} (有很多地方寫成H_{1} ),通常我們將無區別的、不需證明的放在原假設,將有差別的、需要證明的放在備擇假設 (關於如何做假設,下一篇細談)。

在例1中,生產線改造前的均值和方差都已經蓋棺定論瞭,這裡我們就算是已知,改造後待運行穩定後抽樣,這樣我們可以建立的假設如下:

在總體均值和方差已知的條件下,可知這是一個單樣本z檢驗

在例2中,我們感興趣的問題是喜歡新面包的客戶是不是比喜歡老面包的多,也就是說喜歡新面包客戶的比率是不是大於0.5,於是可以建立這樣的假設:

683f3867fe950e68e58a28b0eb9ad9cc

這裡π是總體的比率。這是一個單比率檢驗。

確定顯著性水平α

顯著性水平在這裡也叫第一類風險,大多數情況下取0.05,當然也有取0.1或者0.01的。

驗證前提條件

在很多的方法應用中,都會有一些前提條件,如單樣本z檢驗要求收集的數據要服從正態分佈;方差分析中要求每個樣本都要服從正態分佈,且要滿足方差齊性即方差相等的要求。這是因為每一種檢驗方法都是在這些前提假設中推導出來的,如果這些前提條件不能滿足,則這個方法應用的效果就要大打折扣,這就是在每次檢驗是要驗證前提條件的原因。

確定檢驗統計量

這是關鍵的一步,確定瞭檢驗方法後,就可以列出它的檢驗統計量,如例1中,檢驗統計量就是前面介紹的

b55b845e9ac9568536c42b93ad301271

而例2的檢驗統計量則是

其中n是品嘗面包的客戶數,x是選擇新面包的客戶數。

確定拒絕域

在確定瞭顯著性水平後,即可以根據檢驗統計量計算出拒絕域。所謂的拒絕域,就是根據原假設劃定的一個區域,當所抽樣本計算出的統計量落在這個區域時,就可以拒絕原假設,可想而知,它代表的是樣本遠離原假設的程度。拒絕域有很多種,後面會另行介紹。就本文的例1來說,拒絕域的范圍是z>1.645,是不是覺得這個值很面熟啊?對!在介紹正態分佈的時候重點介紹過。

根據樣本計算檢驗統計量的值並進行判斷

確定瞭拒絕域,下面就是根據樣本計算檢驗統計量的值,如果這個值落在拒絕域中,則拒絕原假設,接受備擇假設;如果沒有落在拒絕域,就說明拒絕原假設的證據還不夠充分,但盡量不要說接受原假設。

現在流行的方法是計算p值,即備擇假設遠離以及更遠離原假設的概率,這主要是因為統計軟件已經非常普及瞭。舉例來說,如果原假設是μ=10,備擇假設是μ>10,抽樣計算出的樣本均值是10.5,則p值就是μ≥10.5的概率;如果備擇假設是μ<10,則p值就是μ≤10.5的概率。將這個p值與α進行比較,如果p<α則說明樣本均值離原假設比較遠,可以拒絕原假設;如果p>α,則說明沒有足夠的證據證明原假設不成立,所以無法拒絕原假設。

將統計判斷結果轉換成實際結果

最後一步,要把統計上得出的結論轉換為實際的結論,並據此作出相應的決策。如在例1中,如果證明備擇假設成立,那就說明老板的錢花對瞭,皆大歡喜;如果證明沒有顯著提高,那還要進一步研究,找出產能沒有有效釋放的原因。

在例2中,由於是離散的二項分佈,要想得出較確切的拒絕原假設的結論有兩種情況,一種是n比較小但p=x/n很大(註意這裡的p與上一小節所說的p值完全不是一個概念),如果樣本量很小的話,你會看到即使p大到0.8、0.9都不一定顯著;另一種是p=x/n比0.5大不瞭多少,但n非常大。沒辦法,熟悉的人都知道,相同樣本量的連續數據所包含的信息要遠遠多於離散數據。因此在對離散數據進行分析時,盡可能獲取大樣本通常是必需的。

請關註我的微信公眾號:張老師漫談六西格瑪

发表回复

相关推荐

《潘氏源流史》之十一:潘佑后裔初探

潘佑后裔初探 潘佑,生于937年①,卒于973年②。幽州人③。他的祖父潘贵,是刘仁恭(唐末藩镇割据者之一)手下的将领,父亲潘 ...

· 24分钟前

全新的2023款豐田皇冠(Toyota Crown)

全新的2023款豐田皇冠(Toyota Crown)以其獨特的外觀,將大膽的設計風格帶到瞭豐田轎車系列的頂端。憑借巨大的車輪、流暢的...

· 32分钟前

一文讀懂微內核

2019年8月9日華為 餘承東 發佈HarmonyOS 1.0,HarmonyOS的發佈將一個計算機領域內非常專業的詞帶到瞭廣大公眾的視線內,這就...

· 37分钟前

加油打工人——《中國飛俠》

今天聊聊電影《中國飛俠》。片名China Hero (2020)。看到本片主演是許君聰、李琦時,我還以為《中國飛俠》是一部喜劇電影,會...

· 37分钟前

楚味荆州 | 飘香的葱油饼,传统与改良你更爱哪种

在荆州,葱油饼代表的不仅仅是一种清晨街道小吃,更是儿时的美好回忆,是学校门口的葱油香,是过早摊头前排的长队。油润酥香 ...

· 41分钟前