雙樣本T檢驗和置信區(qū)間的例子

有時在統(tǒng)計中,找出問題的例子是有幫助的。這些例子可以幫助我們找出類似的問題。在本文中,我們將詳細介紹對兩種人口均值進行推論統(tǒng)計的過程。我們不僅會看到如何對兩種總體均值的差異進行假設檢驗,我們還將為此差異構建置信區(qū)間。我們使用的方法有時稱為雙樣本t檢驗和雙樣本t置信區(qū)間。

問題陳述

假設我們希望測試小學生的數(shù)學能力。我們可能有的一個問題是,更高年級的平均考試成績是否更高。

對27名三年級學生的簡單隨機樣本進行數(shù)學測試,對他們的答案進行評分,結果發(fā)現(xiàn)平均得分為75分,樣本標準差為3分。

對20名五年級學生的簡單隨機樣本進行相同的數(shù)學測試,并對他們的答案進行評分。五年級學生的平均得分為84分,樣本標準差為5分。

在這種情況下,我們提出以下問題:

  • 樣本數(shù)據(jù)小學生生活小常識是否為我們提供證據(jù)表明所有五年級學生的平均考試成績超過所有三年級學生的平均考試成績?
  • 三年級和五年級人群平均考試成績差異的95%置信區(qū)間是多少?

條件和程序

我們必須選擇使用哪個程序。在這樣做時,我們必須確保并檢查是否滿足此程序的條件。我們被要求比較兩種人口手段。可以用來做到這一點的一組方法是雙樣本t程序的方法。

為了使用這些t-程序對于兩個樣品,我們需要確保以下條件成立:

  • 我們從兩個感興趣的人群中獲得了兩個簡單的隨機樣本。
  • 我們的簡單隨機樣本不占總人口的5%。
  • 這兩個樣本彼此獨立,
  • 變量是正態(tài)分布的。
  • 兩個總體的總體均值和標準差均未知。

我們看到大多數(shù)這些條件都得到了滿足。我們被告知我們有簡單的隨機樣本。我們正在研究的人口很多,因為這些年級有數(shù)百萬學生。

我們無法自動假設的條件是測試分數(shù)是否正態(tài)分布。由于我們的樣本量足夠大,因此通過t過程的魯棒性,我們不一定需要變量正態(tài)分布。

由于條件得到滿足,我們進行了一些初步計算。

標準錯誤

標準誤差是標準偏差的估計值。對于此統(tǒng)計信息,我們添加樣本的樣本方差,然后取平方根。這給出了公式:

s2/n+s2/n1/2

通過使用上面的值,我們可以看到標準錯誤的值是

(32/27+52/20)1/2=(1/3+5/4)1/2=1.2583

自由度

我們可以對我們的自由度使用保守的近似值。這可能低估了自由度的數(shù)量,但計算比使用Welch's公式要容易得多。我們使用兩個樣本中較小的一個,然后從這個數(shù)字中減去一個。

例如,兩個樣本中較小的一個是20。這意味著自由度數(shù)是20-1=19。

假設檢驗127 128

我們希望檢驗這樣的假設:五年級學生的平均考試成績大于三年級學生的平均成績。設μ為所有五年級學生人口的平均分。同樣,我們讓μ是所有三年級學生人口的平均得分。

假設如下:

  • H:μ-μ=0
  • H:μ-μ>0

測試統(tǒng)計量是樣本均值之間的差值,然后除以標準誤差。由于我們使用樣本標準差來估計總體標準差,因此t分布的檢驗統(tǒng)計量。

測試統(tǒng)計量的值是(84-75)/1.2583。這大約是7.15。

我們現(xiàn)在確定這個假設檢驗的p值是多少。我們查看測試統(tǒng)計量的值,以及它位于具有19個自由度的t分布上的位置。對于此分布,我們有4.2 x 10-7作為p值。(確定這一點的一種方法是使用T。DIST.RT在Excel中的功能。)

由于我們的p值很小,因此我們拒絕零假設。結論是五年級學生的平均考試成績高于三年級學生的平均考試成績。

置信區(qū)間

由于我們已經(jīng)確定平均分數(shù)之間存在差異,因此我們現(xiàn)在確定這兩種方法之間差異的置信區(qū)間。我們已經(jīng)有了我們需要的大部分。差異的置信區(qū)間需要同時具有估計值和誤差范圍。

兩種方法的差異的估計很容易計算。我們只是找到d樣本均值的差異。樣本均值的這種差異估計了總體均值的差異。

教育資源網(wǎng)_1

對于我們的數(shù)據(jù),樣本均值的差異為84–75=9。

誤差幅度稍難計算。為此,我們需要將適當?shù)慕y(tǒng)計量乘以標準誤差。我們需要的統(tǒng)計數(shù)據(jù)是通過查閱表格或統(tǒng)計軟件找到的。

再次使用保守近似,我們有19個自由度。對于95%的置信區(qū)間,我們看到t*=2.09。我們可以使用Excel中的T.INV函數(shù)來計算這個值。

我們現(xiàn)在把所有事情放在一起,看看我們的誤差幅度是2.09 x 1.2583,大約是2.63。置信區(qū)間為9±2.63。在五年級和三年級學生選擇的測試中,間隔為6.37至11.63分。