兩種人口比例差異的假設(shè)檢驗(yàn)

在本文中,我們將針對(duì)兩個(gè)人口比例的差異,通過(guò)執(zhí)行假設(shè)檢驗(yàn)或顯著性檢驗(yàn)所需的步驟。這使我們能夠比較兩個(gè)未知比例,并推斷它們是否彼此相等或是否一個(gè)大于另一個(gè)。

假設(shè)檢驗(yàn)概述和背景

在我們進(jìn)入假設(shè)檢驗(yàn)的具體細(xì)節(jié)之前,我們將看看假設(shè)檢驗(yàn)的框架。在一個(gè)重要的檢驗(yàn)中,我們?cè)噲D證明關(guān)于人口參數(shù)的價(jià)值(或者有時(shí)是人口本身的性質(zhì))的陳述可能是正確的。

我們通過(guò)進(jìn)行統(tǒng)計(jì)樣本來(lái)積累這個(gè)陳述的證據(jù),我們從這個(gè)樣本中計(jì)算出一個(gè)統(tǒng)計(jì)量稅務(wù)小知識(shí),這個(gè)統(tǒng)計(jì)量的價(jià)值就是我們用來(lái)確定原始陳述的真實(shí)性,這個(gè)過(guò)程包含了不確定性,但是我們能夠量化這個(gè)不確定性

假設(shè)檢驗(yàn)的整個(gè)過(guò)程由下表給出:

  1. 確保滿足我們測(cè)試所需的條件。
  2. 明確說(shuō)明零假設(shè)和替代假設(shè)。另一種假設(shè)可能涉及單側(cè)或雙側(cè)檢驗(yàn)。我們還應(yīng)該確定顯著性水平,用希臘字母alpha表示。
  3. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量。我們使用的統(tǒng)計(jì)類型取決于我們正在進(jìn)行的特定測(cè)試。計(jì)算依賴于我們的統(tǒng)計(jì)樣本。
  4. 計(jì)算p值。檢驗(yàn)統(tǒng)計(jì)量可以轉(zhuǎn)換為p值.p值是在零假設(shè)為真的假設(shè)下單獨(dú)產(chǎn)生檢驗(yàn)統(tǒng)計(jì)量值的概率。總體規(guī)則是p值越小,反對(duì)原假設(shè)的證據(jù)就越大。
  5. 得出結(jié)論。**,我們使用已經(jīng)選擇的alpha值作為閾值ld值。決策規(guī)則是,如果p值小于或等于alpha,則我們拒絕零假設(shè)。否則我們不能拒絕零假設(shè)。

現(xiàn)在我們已經(jīng)看到了假設(shè)檢驗(yàn)的框架,我們將看到兩個(gè)人口比例差異的假設(shè)檢驗(yàn)的細(xì)節(jié)。

Conditions

對(duì)兩種人口比例差異的假設(shè)檢驗(yàn)要求滿足以下條件:

  • 我們有兩個(gè)來(lái)自大群體的簡(jiǎn)單隨機(jī)樣本。這里"大"意味著群體至少比樣本大小大20倍。樣本量用51 n 52和53 n 54表示。我們樣本中的個(gè)體是彼此獨(dú)立選擇的。種群本身也必須是獨(dú)立的。在我們的兩個(gè)樣本中,至少有10個(gè)成功和10個(gè)失敗。59

只要滿足這些條件,我們就可以繼續(xù)進(jìn)行假設(shè)檢驗(yàn)。

科普_1

原假設(shè)和替代假設(shè)

現(xiàn)在我們需要考慮我們的顯著性檢驗(yàn)的假設(shè)。零假設(shè)是我們的無(wú)效陳述。在這種特定類型的假設(shè)檢驗(yàn)中,我們的零假設(shè)是兩個(gè)人口比例之間沒(méi)有差異。我們可以寫這為H:p=p

另一種假設(shè)是三種可能性之一,具體取決于我們正在測(cè)試的具體情況:

  • H:p大于p。這是一個(gè)單尾或單側(cè)測(cè)試。
  • H:p小于p。這也是單面測(cè)試。
  • H:p不等于p。這是一個(gè)雙尾或雙面測(cè)試。

和往常一樣,為了謹(jǐn)慎起見,如果我們這樣做,我們應(yīng)該使用雙面替代假設(shè)在我們獲得樣本之前沒(méi)有一個(gè)方向。這樣做的原因是很難用雙面檢驗(yàn)來(lái)拒絕零假設(shè)。

可以通過(guò)說(shuō)明p-p如何與值零相關(guān)來(lái)重寫這三個(gè)假設(shè)。更具體地說(shuō),零假設(shè)將變?yōu)镠:p-p=0。潛在的替代假設(shè)將寫為:

  • H:p-p>0等于語(yǔ)句&\#34;pp大于p&\35; 34;
  • H:p-p&

    p小于pp-p&>gt;0等于語(yǔ)句#>34;

    pp-ppppp≠0等于語(yǔ)句"p不等于p"

這個(gè)等效公式實(shí)際上向我們展示了事后發(fā)生的事情。我們?cè)谶@個(gè)假設(shè)檢驗(yàn)中所做的是將兩個(gè)參數(shù)pp轉(zhuǎn)換為單個(gè)參數(shù)p-p然后我們根據(jù)值零測(cè)試這個(gè)新參數(shù)。

檢驗(yàn)統(tǒng)計(jì)量

測(cè)試統(tǒng)計(jì)的公式在上圖中給出。每個(gè)術(shù)語(yǔ)的解釋如下:

    第一個(gè)種群的樣本大小為177178個(gè),這個(gè)樣本的成功數(shù)量(在上面的公式中沒(méi)有直接看到)為179個(gè)k 180個(gè)181個(gè)182個(gè),第二個(gè)種群的樣本大小為183個(gè)n 184個(gè),這個(gè)樣本的成功數(shù)量為185個(gè)k 186 187個(gè),樣本比例為p-hat 189k 190/191/n 192和p 193-hat k 194/195/n 196/197.198/199/200然后我們結(jié)合或匯集這兩個(gè)樣本的成功,得到:201 p-hat(k+k)/(n+n).202.203

與往常一樣,在計(jì)算時(shí)要小心操作順序。Everythi在取平方根之前,必須計(jì)算根下方的ng。

P值213 214

下一步是計(jì)算與我們的測(cè)試統(tǒng)計(jì)數(shù)據(jù)相對(duì)應(yīng)的p值。我們使用標(biāo)準(zhǔn)正態(tài)分布進(jìn)行統(tǒng)計(jì),并查閱值表或使用統(tǒng)計(jì)軟件。

我們的p值計(jì)算的細(xì)節(jié)取決于我們使用的替代假設(shè):

  • 對(duì)于H:p-p>0,我們計(jì)算正態(tài)分布的比例大于Z。
  • 對(duì)于H:p-p

    Z。

  • 對(duì)于H:p-p≠0,我們計(jì)算正態(tài)分布大于|Z|,**值Z。此后,為了說(shuō)明我們進(jìn)行了兩尾檢驗(yàn)的事實(shí),我們將比例加倍。

決策規(guī)則

現(xiàn)在我們決定是否拒絕零假設(shè)(從而接受替代方案),或者不拒絕零假設(shè)。我們通過(guò)將我們的p值與顯著性水平α進(jìn)行比較來(lái)做出這個(gè)決定。

  • 如果p值小于或等于alpha,則我們拒絕零假設(shè)。這意味著我們有一個(gè)統(tǒng)計(jì)上顯著的結(jié)果,并且我們將接受替代假設(shè)。
  • 如果p值大于alpha,則我們不能拒絕零假設(shè)。這并不能證明零假設(shè)是正確的。相反,這意味著我們沒(méi)有獲得足夠令人信服的證據(jù)來(lái)拒絕零假設(shè)。

特別說(shuō)明

兩個(gè)種群比例差異的置信區(qū)間并不能集中成功,而假設(shè)檢驗(yàn)確實(shí)如此。原因是在我們的零假設(shè)假設(shè)p-p=0。置信區(qū)間不假設(shè)這一點(diǎn)。一些統(tǒng)計(jì)學(xué)家沒(méi)有將這一假設(shè)檢驗(yàn)的成功集中起來(lái),而是使用稍微修改的版本的上述測(cè)試統(tǒng)計(jì)。

311