什么是P值?

假設(shè)檢驗(yàn)或顯著性檢驗(yàn)涉及計(jì)算稱為p值的數(shù)字。這個(gè)數(shù)字對于我們的測試結(jié)束非常重要。P值與檢驗(yàn)統(tǒng)計(jì)量有關(guān),并為我們提供了針對零假設(shè)的證據(jù)度量。

Null and Alternative hypothesis

統(tǒng)計(jì)顯著性檢驗(yàn)均以零假設(shè)和替代假設(shè)開始。零假設(shè)是沒有效果的陳述或普遍接受的事務(wù)狀態(tài)的陳述。另一種假設(shè)是我們試圖證明的。假設(shè)檢驗(yàn)中的工作假設(shè)是零假設(shè)是正確的。

14檢驗(yàn)統(tǒng)計(jì)量15 16

我們將假設(shè)我們正在使用的特定測試符合條件。一個(gè)簡單的隨機(jī)樣本給我們樣本數(shù)據(jù)。根據(jù)這些數(shù)據(jù),我們可以計(jì)算出一個(gè)檢驗(yàn)統(tǒng)計(jì)量。測試統(tǒng)計(jì)數(shù)據(jù)差異很大,取決于我們的假設(shè)檢驗(yàn)涉及的參數(shù)。一些常見的測試統(tǒng)計(jì)數(shù)據(jù)包括:

  • z-當(dāng)我們知道人口標(biāo)準(zhǔn)差時(shí),關(guān)于人口均值的假設(shè)檢驗(yàn)的統(tǒng)計(jì)量。
  • t-關(guān)于人口均值的假設(shè)檢驗(yàn)的統(tǒng)計(jì)量,當(dāng)我們不知道人口標(biāo)準(zhǔn)差時(shí)。
  • t-關(guān)于兩個(gè)差異的假設(shè)檢驗(yàn)的統(tǒng)計(jì)量當(dāng)我們不知道兩個(gè)種群中任何一個(gè)種群的標(biāo)準(zhǔn)差時(shí),獨(dú)立種群的意思是。
  • z-關(guān)于種群比例的假設(shè)檢驗(yàn)的統(tǒng)計(jì)量。
  • 卡方-關(guān)于分類數(shù)據(jù)的預(yù)期和實(shí)際計(jì)數(shù)之間的差異的假設(shè)檢驗(yàn)的統(tǒng)計(jì)量。

計(jì)算P值

測試統(tǒng)計(jì)信息很有用,但為這些統(tǒng)計(jì)信息分配p值可能會(huì)更有幫助。p值是這樣的概率:如果零假設(shè)是真的,我們將觀察到一個(gè)狀態(tài)至少與觀察到的一樣極端。為了計(jì)算p值,我們使用與我們的測試統(tǒng)計(jì)信息相對應(yīng)的適當(dāng)軟件或統(tǒng)計(jì)表。

例如,在計(jì)算z檢驗(yàn)統(tǒng)計(jì)量時(shí),我們將使用標(biāo)準(zhǔn)正態(tài)分布。**值較大(例如超過2.5的**值)z的值不是很常見,并且會(huì)給出較小的p值。更接近零的z值更常見,并且會(huì)給出更大的p值。

解釋P值

正如我們已經(jīng)指出的,p值是概率。這意味著它是0和1的實(shí)數(shù)。雖然測試統(tǒng)計(jì)量是衡量特定樣本統(tǒng)計(jì)量極端程度的一種方法,但p值是衡量這一點(diǎn)的另一種方法。

當(dāng)我們獲得統(tǒng)計(jì)給定的樣本時(shí),我們應(yīng)該始終是的問題是:“這個(gè)樣本是偶然的,只有一個(gè)真正的零假設(shè),還是零假設(shè)是錯(cuò)誤的?“如果我們的p值很小,那么這可能意味著以下兩件事之一:

  1. 零假設(shè)是正確的,但我們很幸運(yùn)獲得觀察到的樣本。
  2. 我們的樣本是由于零假設(shè)是錯(cuò)誤的事實(shí)。

通常,p值越小,我們反對零假設(shè)的證據(jù)就越多。

有多小?

為了拒絕零假設(shè),我們需要多小的p值?對此的答案是“它取決于”。一個(gè)常見的經(jīng)驗(yàn)法則是p值必須小于或等于0.05,但對此值沒有任何普遍性。

通常,在我們進(jìn)行假設(shè)檢驗(yàn)之前,我們選擇一個(gè)閾值。如果我們有任何小于或等于此閾值的p值,則拒絕零假設(shè)。否則我們不能拒絕零假設(shè)。這個(gè)閾值被稱為級別我們的假設(shè)檢驗(yàn)具有重要意義,并用希臘字母alpha表示。沒有alpha值總是定義統(tǒng)計(jì)顯著性。

小學(xué)生健康知識(shí)手抄報(bào)

教育_1