有或沒有更換的取樣

統(tǒng)計抽樣可以通過多種不同的方式完成。除了我們使用的抽樣方法的類型之外,還有另一個問題涉及我們隨機選擇的個人具體發(fā)生了什么。抽樣時出現(xiàn)的問題是"在我們選擇個人并記錄測量值之后我們'重新學習,我們對個人做什么?"

有兩種選擇:

  • 我們可以將個人替換回我們正在采樣的池中。
  • 我們可以選擇不替換個人。

我們可以很容易地看到這些導致兩種不同的情況。在第一種選擇中,替換留下了第二次隨機選擇個體的可能性。對于第二種選擇,如果我們在沒有替換的情況下工作,則不可能選擇同一個人兩次。我們將看到這種差異將影響與這些樣本相關的概率的計算。生理健康知識

對概率的影響

要了解我們如何處理替換會影響概率的計算,請考慮以下示例問題。從標準甲板上抽取兩個ACE的概率是多少?

這個問題是模棱兩可的。一旦我們畫了第一張卡會發(fā)生什么?我們是把它放回甲板上,還是把它放出來?

我們從計算替換概率開始。共有四張ace和52張卡片,因此繪制一張ace的概率為4/52。如果我們更換此卡并再次繪制,則概率再次為4/52。這些事件是獨立的,因此我們將概率(4/52)x(4/52)=1/169或大約0.592%乘以。

現(xiàn)在我們將把它與同樣的情況進行比較,除了我們不更換卡片。第一次抽獎時繪制ace的概率仍然是4/52。對于第二張卡,我們我們現(xiàn)在必須計算一個條件概率。換句話說,我們需要知道繪制第二個ace的概率,因為第一張卡也是ace。

現(xiàn)在共有51張牌中剩余3張牌。因此,繪制ace后第二個ace的條件概率為3/51。繪制兩個ace而不進行替換的概率為(4/52)x(3/51)=1/221,或約0.425%。

我們直接從上面的問題中看到,我們選擇替換的內容會影響概率值。它可以顯著改變這些值。

人口規(guī)模

在某些情況下,有或沒有替換的抽樣并沒有實質性地改變任何概率。假設我們是從一個人口為50000的城市中隨機選擇兩個人,其中30000人是女性。

如果我們用替換樣本,那么第一次選擇女性的概率為30000/50000=60%。第二次選擇女性的概率仍然為60%。兩個人都是女性的概率為0.6 x 0.6=0.36。

如果我們在沒有替換的情況下進行采樣,那么第一個概率不受影響。第二個概率現(xiàn)在是29999/49999=0.5999919998…,這非常接近60%。兩者都是女性的概率是0.6 x 0.5999919998=0.359995。

概率在技術上是不同的,然而,它們足夠接近幾乎無法區(qū)分。因此,很多時候,即使我們在沒有替換的情況下進行抽樣,我們也會將每個人的選擇視為獨立于樣本中的其他人。

其他應用程序

在其他情況下,我們需要考慮是否在有或沒有更換的情況下進行采樣。例如,這是自舉. 該統(tǒng)計技術屬于重采樣技術的標題。

在引導中,我們從人口的統(tǒng)計樣本開始。然后,我們使用計算機軟件來計算引導程序樣本。換句話說,計算機重新采樣并更換初始樣本。

教育資源網(wǎng)_1