什么是方差分析?

很多時候,當我們研究一個群體時,我們真的在比較兩個群體。根據(jù)我們感興趣的這個小組的參數(shù)和我們處理的條件,有幾種技術(shù)可用。涉及兩個種群比較的統(tǒng)計推斷程序通常不能應用于三個或更多種群。為了一次研究兩個以上的人群,我們需要不同類型的統(tǒng)計工具。方差分析或ANOVA是一種來自統(tǒng)計干擾的技術(shù),它允許我們處理幾個種群。

均值比較

為了了解出現(xiàn)什么問題以及為什么我們需要方差分析,我們將考慮一個例子。假設我們試圖確定綠色,紅色,藍色和橙色M&M糖果的平均重量是否彼此不同。我們將分別說明每個群體的平均權(quán)重,μ,μ,μ和。我們可以多次使用適當?shù)募僭O檢驗,并檢驗C(4,2)或六個不同的零假設:

  • H:μ=μ檢查紅色念珠菌種群的平均重量是否不同于藍色念珠菌種群的平均重量。
  • H:μ=μ檢查藍色念珠菌種群的平均重量是否不同于綠色念珠菌種群的平均重量。
  • H:μ=μ檢查平均值綠色糖果種群的重量不同于橙色糖果種群的平均重量。
  • H:μ=μ檢查橙色糖果種群的平均重量是否不同于紅色糖果種群的平均重量。
  • H:μ=μ檢查紅色糖果不同于綠色糖果種群的平均重量。
  • H:μ=μ檢查藍色糖果種群的平均重量是否不同于人口的平均重量橙色糖果。

這種分析存在許多問題。我們將有六個p-值。即使我們可以以95%的置信水平進行測試,但我們對整個過程的信心也小于此,因為概率乘以:.95 x.95 x.95 x.95 x.95大約是.74,或74%的信心水平。因此,I型錯誤的可能性增加了。

在更基本的層面上,我們無法通過一次比較兩個參數(shù)來比較這四個參數(shù)。紅色和藍色M&Ms的平均值可能很重要,紅色的平均重量相對大于藍色的平均重量。但是,當我們考慮所有四種糖果的平均重量時,可能沒有顯著差異。

方差分析

為了處理我們需要進行多重比較的情況,我們使用ANOVA。該測試允許我們一次考慮幾個群體的參數(shù),而無需通過一次對兩個參數(shù)進行假設檢驗來解決我們面臨的一些問題。

為了用上面的M&M實施例進行ANOVA,我們將測試零假設H:μ=μ=μ=μ。這表明紅色,藍色和綠色M&Ms的平均權(quán)重之間沒有差異。另一種假設是紅色,藍色,綠色和橙色M&Ms的平均權(quán)重之間存在一些差異。這個假設實際上是幾個陳述的組合H:

  • 紅色念珠菌群體的平均重量不等于藍色念珠菌群體的平均重量,或
  • 藍色念珠菌群體的平均重量不等于綠色念珠菌群體的平均重量,或
  • 綠色糖果種群的平均重量不等于橙色糖果種群的平均重量,或
  • 綠色糖果種群的平均重量不等于紅色念珠菌群體的平均重量,或
  • 藍色念珠菌群體的平均重量不等于橙色念珠菌群體的平均重量,或
  • 藍色念珠菌群體的平均重量不等于紅色念珠菌群體的平均重量。

在這個特定的例子中,為了獲得我們的p值,我們將利用稱為F分布的概率分布。涉及ANOVA F檢驗的計算可以手工完成,但通常用統(tǒng)計軟件計算。

廣州科普

多重比較

將ANOVA與其他統(tǒng)計技術(shù)分開的是它用于進行多重比較。這在整個統(tǒng)計數(shù)據(jù)中都很常見,因為有很多時候我們想比較兩組以上。通常,總體測試表明我們正在研究的參數(shù)之間存在某種差異。然后,我們通過其他一些分析來確定哪個參數(shù)不同。