什么是統(tǒng)計引導?
Bootstrapping是一種統(tǒng)計技術,屬于更廣泛的重采樣標題。該技術涉及一個相對簡單的過程,但重復了很多次,嚴重依賴于計算機計算。Bootstrapping提供了一種除置信區(qū)間之外的方法來估計總體參數(shù)。Bootstrapping似乎很像魔術。繼續(xù)閱讀以了解它如何獲得有趣的名稱。
引導的解釋
推理統(tǒng)計的一個目標是確定人口參數(shù)的值。直接測量這一點通常太昂貴甚至不可能。所以我們使用統(tǒng)計抽樣。我們對人口進行抽樣,測量此樣本的統(tǒng)計數(shù)據(jù),然后使用此統(tǒng)計數(shù)據(jù)來說明人口的相應參數(shù)。
例如,在巧克力工廠,我們可能想保證糖果棒具有特定的平均重量。稱量生產(chǎn)的每一個糖果棒都是不可行的,所以我們使用抽樣技術隨機選擇100個糖果棒。我們計算這100個糖果酒吧的平均值,并說人口平均值落在我們樣本平均值的誤差范圍內。
假設幾個月后我們想更準確地知道-或者更少的誤差范圍-我們在采樣生產(chǎn)線當天的平均糖果重量是多少。我們不能使用今天的糖果酒吧,因為進入圖片的變量太多(不同批次的牛奶,糖和可可豆,不同的太空的小知識大氣條件,不同的員工在線等)。從我們好奇的那一天起,我們所擁有的就是100個重量。如果沒有時間機器回到那一天,看起來最初的誤差幅度是我們所能希望的**的。
幸運的是,我們可以使用自舉技術。在這種情況下,我們用repl隨機抽樣從100個已知重量開始。然后我們稱之為引導程序樣本。由于我們允許更換,因此此引導程序樣本很可能與我們的初始樣本不同。某些數(shù)據(jù)點可能會重復,而自舉樣本中可能會省略最初100個數(shù)據(jù)點中的其他數(shù)據(jù)點。在計算機的幫助下,可以在相對較短的時間內構建數(shù)千個引導程序樣本。
示例
如上所述,要真正使用引導技術,我們需要使用計算機。以下數(shù)值示例將有助于演示該過程的工作原理。如果我們從樣本2,4,5,6,6開始,那么以下所有都是可能的引導樣本:
- 34,2,5,5,6,6,35,36,4,5,6,6,37,38,2,2,4,5,5,39,40,2,2,2,4,6,41,42,2,2,2,2,2,43,44,4,6,6,6,45
技術史
Bootstrap技術在統(tǒng)計領域相對較新。第一次使用是由Bradley Efron在1979年的一篇論文中發(fā)表的。隨著計算能力的提高和成本的降低,自舉技術變得越來越普遍。
為什么名稱引導?
“bootstrapping”這個名字來自“用他的bootstraps抬起自己”這個詞。這是指一種傲慢而不可能的事情。盡可能努力地嘗試,你不能通過拖拉靴子上的皮革片來抬起自己。
有一些數(shù)學理論證明自舉技術是合理的。但是,使用自舉確實感覺你正在做不可能的事情。盡管似乎無法通過一次又一次地重復使用相同的樣本來改進總體統(tǒng)計的估計,但實際上,引導可以做到這一點。