如何構(gòu)建人口比例的置信區(qū)間

置信區(qū)間可用于估計(jì)幾個(gè)總體參數(shù)??梢允褂猛普摻y(tǒng)計(jì)來估計(jì)的一種類型的參數(shù)是人口比例。例如,我們可能想知道支持特定立法的美國(guó)人口的百分比。對(duì)于這種類型的問題,我們需要找到一個(gè)置信區(qū)間。

在本文中,我們將看到如何構(gòu)建人口比例的置信區(qū)間,并研究其背后的一些理論。

總體框架

我們首先看看大局,然后再詳細(xì)介紹。我們將考慮的置信區(qū)間類型如下:

估計(jì)+/-誤差范圍

這意味著我們需要確定兩個(gè)數(shù)字。這些值是所需參數(shù)的估計(jì)值,以及誤差范圍。

Conditions

在進(jìn)行任何統(tǒng)計(jì)測(cè)試或程序之前,重要的是要確保滿足所有條件。對(duì)于人口比例的置信區(qū)間,我們需要確保以下內(nèi)容成立:

    我們有一個(gè)簡(jiǎn)單的隨機(jī)樣本,大小為35 n 36,來自大量人口37我們的個(gè)人是相互獨(dú)立選擇的。我們的樣本中至少有15個(gè)成功,15個(gè)失敗。41

如果**一項(xiàng)不滿意,那么可以稍微調(diào)整我們的樣本并使用加四置信區(qū)間。在下文中,我們將假設(shè)滿足了上述所有條件。

樣本和人口比例

我們從人口比例的估計(jì)開始。就像我們使用樣本均值來估計(jì)總體均值一樣,我們使用樣本比例來估計(jì)總體比例。人口比例是一個(gè)未知的參數(shù)之三。樣本比例是一個(gè)統(tǒng)計(jì)數(shù)據(jù)。通過計(jì)算樣本中成功的次數(shù),然后除以樣本中的總?cè)藬?shù),可以找到此統(tǒng)計(jì)信息。

人口比例用p表示,并且是不言自明的。樣本比例的符號(hào)更為復(fù)雜。我們將樣本比例表示為p?,我們將此符號(hào)讀為"p-hat"因?yàn)樗雌饋硐褡帜?em>p,頂部是帽子。

這成為我們置社區(qū)科普計(jì)劃信區(qū)間的第一部分。p的估計(jì)值為p?。

樣本比例的抽樣分布

為了確定誤差幅度的公式,我們需要考慮p?的抽樣分布。我們需要知道我們正在處理的平均值,標(biāo)準(zhǔn)差和特定分布。

p?的抽樣分布是二項(xiàng)分布,成功概率pn試驗(yàn)。這種類型的隨機(jī)變量的平均值p,標(biāo)準(zhǔn)差(p(1-p)/n0.5。這有兩個(gè)問題。

第一個(gè)問題是二項(xiàng)式分布可能非常棘手。因子的存在會(huì)導(dǎo)致一些非常大的數(shù)字。這是條件幫助我們的地方。只要滿足我們的條件,我們就可以用標(biāo)準(zhǔn)正態(tài)分布來估計(jì)二項(xiàng)式分布。

第二個(gè)問題是p?的標(biāo)準(zhǔn)偏差在其定義中使用p。未知的總體參數(shù)將通過使用與誤差范圍非常相同的參數(shù)來估計(jì)。這種循環(huán)推理是一個(gè)需要解決的問題。

解決這個(gè)難題的方法是用標(biāo)準(zhǔn)誤差代替標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)錯(cuò)誤基于統(tǒng)計(jì)數(shù)據(jù),而不是參數(shù)。使用標(biāo)準(zhǔn)誤差來估計(jì)標(biāo)準(zhǔn)差。使這一策略值得的是,我們不再需要知道參數(shù)p。的值

公式

為了使用標(biāo)準(zhǔn)錯(cuò)誤,我們用統(tǒng)計(jì)量p?替換未知參數(shù)p。結(jié)果是人口比例置信區(qū)間的以下公式:

p?+/-z*(p?(1-p?)/n0.5。

這里z*的值由我們的置信水平C確定。對(duì)于標(biāo)準(zhǔn)正態(tài)分布,C標(biāo)準(zhǔn)正態(tài)分布的百分比恰好在z*的共同值包括90%置信度的1.645和95%置信度的1.96。

示例

讓我們看看這種方法如何與一個(gè)例子一起工作。假設(shè)我們希望以95%的置信度知道一個(gè)自稱為民主的縣的選民所占的百分比。我們?cè)谶@個(gè)縣進(jìn)行了一個(gè)100人的簡(jiǎn)單隨機(jī)樣本。發(fā)現(xiàn)其中64人確定為民主者。

我們看到所有條件都得到滿足。我們的人口比例估計(jì)為64/100=0.64。這是樣本比例p?的值,它是我們置信區(qū)間的中心。

誤差范圍由兩部分組成。第一部分是z*。正如我們所說,對(duì)于95%置信度,z*=1.96的值。

誤差范圍的另一部分由公式(p?(1-p?)/n0.5給出。我們?cè)O(shè)置p?=0.64并計(jì)算=標(biāo)準(zhǔn)誤差為(0.64(0.36)/100)0.5=0.048。

我們將這兩個(gè)數(shù)字相乘,得到0.09408的誤差范圍。最終結(jié)果是:

0.64+/-0.09408,

或者我們可以將其重寫為54.592%至73.408%。因此我們95%的人相信民主人的真實(shí)人口比例在這些百分比的范圍內(nèi)。這意味著從長(zhǎng)遠(yuǎn)來看,我們的技術(shù)和公式將在95%的時(shí)間內(nèi)占據(jù)人口比例。

相關(guān)想法

有許多想法和主題與這種類型的置信區(qū)間有關(guān)。例如,我們可以進(jìn)行關(guān)于人口比例價(jià)值的假設(shè)檢驗(yàn)。我們也可以比較來自兩個(gè)不同人群的兩個(gè)比例。

教育資源網(wǎng)_1