假設(shè)檢驗中I型和II型錯誤的區(qū)別
假設(shè)檢驗的統(tǒng)計實踐不僅在統(tǒng)計學(xué)中廣泛存在,而且在整個自然科學(xué)和社會科學(xué)中都很普遍。當(dāng)我們進(jìn)行假設(shè)檢驗時,有幾件事情可能會出錯。有兩種錯誤,設(shè)計上無法避免,我們必須意識到存在這些錯誤。這些錯誤給出了I型和II型錯誤的行人名稱。什么是I型和II型錯誤,以及我們?nèi)绾螀^(qū)分它們?簡單地說:
- 類型I錯誤發(fā)生在我們拒絕一個真正的零假設(shè)時
為了理解這些陳述,我們將探索這些類型錯誤背后的更多背景。
假設(shè)檢驗19 20
假設(shè)檢驗的過程似乎因大量檢驗統(tǒng)計數(shù)據(jù)而變化很大。但一般過程是一樣的。假設(shè)檢驗涉及零假設(shè)的陳述和顯著性水平的選擇。零假設(shè)是真的或假的,代表治療或程序的默認(rèn)聲明。例如,在檢查藥物的有效性時,零假設(shè)是藥物對疾病沒有影響。
在制定零假設(shè)并選擇顯著性水平后,我們通過觀察獲取數(shù)據(jù)。統(tǒng)計計算告訴我們是否應(yīng)該拒絕零假設(shè)。
在一個理想的世界中,當(dāng)假設(shè)是錯誤的時候兒童科普手抄報,我們總是拒絕零假設(shè),當(dāng)它確實是真的時,我們不會拒絕零假設(shè)。但是還有另外兩種情況是可能的,每種情況都會導(dǎo)致錯誤。
類型I錯誤
第一種可能的錯誤涉及拒絕實際上為真的零假設(shè)。這種錯誤稱為I類錯誤有時被稱為第一類錯誤。
I型錯誤相當(dāng)于誤報。讓我們回到一種用于治療疾病的藥物的例子。如果我們在這種情況下拒絕零假設(shè),那么我們的說法是該藥物實際上對疾病有一定影響。但是,如果零假設(shè)是真的,那么實際上,這種藥物根本不能對抗這種疾病。該藥被錯誤地聲稱對疾病有積極作用。
可以控制類型I錯誤。與我們選擇的顯著性水平相關(guān)的alpha值直接影響I型錯誤。Alpha是我們有I型錯誤的**概率。對于95%的置信水平,alpha的值為0.05。這意味著我們有5%的概率拒絕真正的零假設(shè)。從長遠(yuǎn)來看,我們在此級別執(zhí)行的每二十個假設(shè)檢驗中就有一個會導(dǎo)致I型錯誤。
類型II錯誤
當(dāng)我們不拒絕錯誤的零假設(shè)時,可能會發(fā)生另一種錯誤。這種錯誤稱為II型錯誤,也稱為第二類錯誤。
II型錯誤相當(dāng)于假陰性。如果我們再次回到我們正在測試藥物的情況,那么II型錯誤會是什么樣子?如果我們接受該藥物對疾病沒有影響,就會發(fā)生II型錯誤,但實際上確實如此。
希臘字母beta給出了II型錯誤的概率。這個數(shù)字與假設(shè)檢驗的功效或敏感性有關(guān),用1-beta表示。
如何避免錯誤
I型和II型錯誤是假設(shè)檢驗過程的一部分。雖然無法完全消除錯誤,但我們可以**限度地減少一種類型的錯誤。
通常當(dāng)我們試圖降低概率時一種類型的錯誤,另一種類型的概率增加。我們可以將α的值從0.05降低到0.01,相當(dāng)于99%的置信度。但是,如果其他一切保持不變,那么II型錯誤的概率幾乎總是增加。
很多時候,我們假設(shè)檢驗的實際應(yīng)用將決定我們是否更接受I型或II型錯誤。這將在我們設(shè)計統(tǒng)計實驗時使用。