如何在統(tǒng)計(jì)中找到自由度
許多統(tǒng)計(jì)推斷問(wèn)題要求我們找到自由度的數(shù)量。自由度數(shù)從無(wú)限多中選擇單個(gè)概率分布。在置信區(qū)間的計(jì)算和假設(shè)檢驗(yàn)的工作中,這一步驟是一個(gè)經(jīng)常被忽視但至關(guān)重要的細(xì)節(jié)。
自由度數(shù)沒(méi)有一個(gè)通用公式。但是,在推論統(tǒng)計(jì)中,每種類型的過(guò)程都使用特定的公式。換句話說(shuō),我們正在進(jìn)行的設(shè)置將決定自由度的數(shù)量。接下來(lái)是一些最常見(jiàn)的推理過(guò)程的部分列表,以及每種情況下使用的自由度數(shù)。
Standard Normal Distribution
列出了涉及標(biāo)準(zhǔn)正態(tài)分布的程序的完整性并澄清了一些誤解。這些程序不要求我們找到自由度的數(shù)量。原因是存在單個(gè)標(biāo)準(zhǔn)正態(tài)分布。這些類型的程序包括已知人口標(biāo)準(zhǔn)偏差時(shí)涉及人口平均數(shù)的程序,以及涉及人口比例的程序。
One Sample T Procedures
有時(shí)統(tǒng)計(jì)實(shí)踐要求我們使用學(xué)生的t分布。對(duì)于這些程序,例如處理人口標(biāo)準(zhǔn)偏差未知的人口均值的程序,自由度數(shù)比樣本量少一個(gè)。因此,如果樣本大小為n,則存在n-1個(gè)自由度。
T程序與配對(duì)數(shù)據(jù)
很多時(shí)候?qū)?shù)據(jù)視為配對(duì)是有意義的。配對(duì)通常是由于我們對(duì)中第一個(gè)和第二個(gè)值之間的連接而執(zhí)行的。我們會(huì)在測(cè)量之前和之后配對(duì)很多次。我們的pai樣本紅色數(shù)據(jù)不是獨(dú)立的;但是,每對(duì)之間的差異是獨(dú)立的。因此,如果樣本具有總共n對(duì)數(shù)據(jù)點(diǎn)(總共2n值),則存在n-1個(gè)自由度。
兩個(gè)獨(dú)立人群的T程序
對(duì)于這些類型的問(wèn)題,我們?nèi)栽谑褂胻分布。這次是我們每個(gè)人口的樣本。盡管**將這兩個(gè)樣本的大小相同,但對(duì)于我們的統(tǒng)計(jì)程序而言這并不是必需的。因此,我們可以有兩個(gè)大小分別為n和n的樣本家庭安全小常識(shí)。有兩種方法可以確定自由度數(shù)。更準(zhǔn)確的方法是使用韋爾奇公式,這是一個(gè)計(jì)算繁瑣的公式,涉及樣本量和樣本標(biāo)準(zhǔn)偏差。另一種方法,稱為保守近似,可用于快速估計(jì)自由度。這只是兩個(gè)數(shù)字n-1和n-1中的較小者。
卡方獨(dú)立
卡方檢驗(yàn)的一個(gè)用途是查看兩個(gè)分類變量(每個(gè)變量都有幾個(gè)級(jí)別)是否表現(xiàn)出獨(dú)立性。關(guān)于這些變量的信息記錄在具有r行和c列的雙向表中。自由度數(shù)是乘積(r-1)(c-1)。
卡方擬合優(yōu)度
卡方擬合優(yōu)度從單個(gè)分類變量開(kāi)始,總共n個(gè)級(jí)別。我們測(cè)試這個(gè)變量與預(yù)定模型匹配的假設(shè)。自由度的數(shù)量比等級(jí)的數(shù)量少一個(gè)。換句話說(shuō),有n-1個(gè)自由度。
單因素方差分析
單因素方差分析(ANOVA)允許我們?cè)趲讉€(gè)群體之間進(jìn)行比較,消除了多重成對(duì)假設(shè)的需要是測(cè)試。由于測(cè)試要求我們測(cè)量幾個(gè)組之間的變化以及每個(gè)組內(nèi)的變化,因此我們最終得到兩個(gè)自由度。用于單因素方差分析的F統(tǒng)計(jì)量是一個(gè)分?jǐn)?shù)。分子和分母各自具有自由度。令c為組數(shù),n為數(shù)據(jù)值總數(shù)。分子的自由度數(shù)小于組數(shù),或c-1。分母的自由度數(shù)是數(shù)據(jù)值的總數(shù)減去組數(shù),或n-c。
很明顯,我們必須非常小心地知道我們正在使用哪種推理程序。這些知識(shí)將告訴我們正確的使用自由度數(shù)量。