有或沒有更換的取樣
統(tǒng)計抽樣可以通過多種不同的方式完成。除了我們使用的抽樣方法的類型之外,還有另一個問題涉及我們隨機選擇的個人具體發(fā)生了什么。抽樣時出現(xiàn)的問題是"在我們選擇個人并記錄測量值之后我們'重新學習,我們對個人做什么?"
有兩種選擇:
- 我們可以將個人替換回我們正在采樣的池中。
- 我們可以選擇不替換個人。
我們可以很容易地看到這些導致兩種不同的情況。在第一種選擇中,替換留下了第二次隨機選擇個體的可能性。對于第二種選擇,如果我們在沒有替換的情況下工作,則不可能選擇同一個人兩次。我們將看到這種差異將影響與這些樣本相關(guān)的概率的計算。生理健康知識
對概率的影響
要了解我們?nèi)绾翁幚硖鎿Q會影響概率的計算,請考慮以下示例問題。從標準甲板上抽取兩個ACE的概率是多少?
這個問題是模棱兩可的。一旦我們畫了第一張卡會發(fā)生什么?我們是把它放回甲板上,還是把它放出來?
我們從計算替換概率開始。共有四張ace和52張卡片,因此繪制一張ace的概率為4/52。如果我們更換此卡并再次繪制,則概率再次為4/52。這些事件是獨立的,因此我們將概率(4/52)x(4/52)=1/169或大約0.592%乘以。
現(xiàn)在我們將把它與同樣的情況進行比較,除了我們不更換卡片。第一次抽獎時繪制ace的概率仍然是4/52。對于第二張卡,我們我們現(xiàn)在必須計算一個條件概率。換句話說,我們需要知道繪制第二個ace的概率,因為第一張卡也是ace。
現(xiàn)在共有51張牌中剩余3張牌。因此,繪制ace后第二個ace的條件概率為3/51。繪制兩個ace而不進行替換的概率為(4/52)x(3/51)=1/221,或約0.425%。
我們直接從上面的問題中看到,我們選擇替換的內(nèi)容會影響概率值。它可以顯著改變這些值。
人口規(guī)模
在某些情況下,有或沒有替換的抽樣并沒有實質(zhì)性地改變?nèi)魏胃怕?。假設(shè)我們是從一個人口為50000的城市中隨機選擇兩個人,其中30000人是女性。
如果我們用替換樣本,那么第一次選擇女性的概率為30000/50000=60%。第二次選擇女性的概率仍然為60%。兩個人都是女性的概率為0.6 x 0.6=0.36。
如果我們在沒有替換的情況下進行采樣,那么第一個概率不受影響。第二個概率現(xiàn)在是29999/49999=0.5999919998…,這非常接近60%。兩者都是女性的概率是0.6 x 0.5999919998=0.359995。
概率在技術(shù)上是不同的,然而,它們足夠接近幾乎無法區(qū)分。因此,很多時候,即使我們在沒有替換的情況下進行抽樣,我們也會將每個人的選擇視為獨立于樣本中的其他人。
其他應用程序
在其他情況下,我們需要考慮是否在有或沒有更換的情況下進行采樣。例如,這是自舉. 該統(tǒng)計技術(shù)屬于重采樣技術(shù)的標題。
在引導中,我們從人口的統(tǒng)計樣本開始。然后,我們使用計算機軟件來計算引導程序樣本。換句話說,計算機重新采樣并更換初始樣本。