平均值,中位數和模式之間的經驗關系

在數據集中,有各種描述性統(tǒng)計數據。平均值,中位數和模式都給出了數據中心的度量,但是它們以不同的方式計算:

  • 通過將所有數據值加在一起,然后除以值的總數來計算平均值。
  • 通過按升序列出數據值,然后在列表中找到中間值來計算中位數。
  • 通過計算每個值發(fā)生多少次來計算模式。頻率**的值是模式。

從表面上看,這三個數字之間似乎沒有聯(lián)系。然而,事實證明,這些中心指標之間存在經驗關系。

理論與經驗

在我們繼續(xù)之前,重要的是要了解我們在提及經驗關系時所說的內容,并將其與理論研究進行對比。統(tǒng)計和其他知識領域的一些結果可以從理論上的一些先前的陳述中得出。我們從我們所知道的開始,然后使用邏輯,數學和演繹推理,看看這在哪里引導我們。結果是其他已知事實的直接后果。

與理論相比,是獲取知識的經驗方式。我們可以觀察周圍的世界,而不是從已經確立的原則推理。從這些觀察中,我們可以對我們所看到的進行解釋。大部分科學都是以這種方式完成的。實驗給了我們經驗數據。然后目標是制定適合所有數據的解釋。

經驗關系

在統(tǒng)計中,均值,中位數和模式之間存在經驗關系。無數數據集的觀察表明,大多數時候平均值之間的差異模式是平均值和中位數之差的三倍。等式中的這種關系是:

平均模式=3(平均值-中位數)。

示例

要了解上述與現(xiàn)實世界數據的關系,我們來看看2010年的美國州人口。以百萬計,人口為:加利福尼亞州-36.4,德克薩斯州-23.5,紐約-19.3,佛羅里達州-18.1,伊利諾伊州-12.8,賓夕法尼亞州-12.4,俄亥俄州-11.5,密歇根州-10.1,格魯吉亞-9.4,北卡羅來納州-8.9,新澤西州社區(qū)開展健康知識講座-8.7,弗吉尼亞州-7.6,馬薩諸塞州-6.4,華盛頓州-6.4,印第安納州-6.3,亞利桑那州-6.2,田納西州-6.0,密蘇里州-5.8,馬里蘭州-5.6,威斯康星州-5.6,明尼蘇達州-5.2,科羅拉多州-4.8,阿拉巴馬州-4.6,南卡羅來納州-4.3,路易斯安那州-4.3,肯塔基州-4.2,俄勒岡州-3.7,俄克拉荷馬州-3.6,康涅狄格州-3.5,愛荷華州-3.0,密西西比州-2.9,阿肯色州-2.8,堪薩斯州-2.8,猶他州-2.6,內華達州-2.5,新墨西哥州-2.0,西弗吉尼亞州-1.8,內布拉斯加州-1.8,愛達荷州-1.5,緬因州-1.3,新罕布什爾州-1.3,夏威夷-1.3,羅德島-1.1,蒙大拿州-.9,特拉華州-.9,南達科他州-.8,阿拉斯加-.7,北達科他州-.6,佛蒙特州-.6,懷俄明州-.5

平均人口為600萬。中位人口為425萬。該模式是130萬?,F(xiàn)在我們將計算出與上述差異:

  • 平均模式=600萬–130萬=470萬。
  • 3(平均中位數)=3(600萬–425萬)=3(175萬)=525萬。

雖然這兩個差異數字不完全匹配,但它們彼此相對接近。

應用程序

上述公式有幾個應用程序。假設我們沒有數據值列表,但知道平均值,中位數或模式中的任何兩個。上述公式可用于估算第三個未知數量。

例如,如果我們知道我們的平均值是10,那么一個月de of 4,我們的數據集的中位數是多少?由于平均模式=3(平均值-中位數),我們可以說10-4=3(10中位數)。通過一些代數,我們看到2=(10中位數),因此我們數據的中位數為8。

上述公式的另一個應用是計算偏度。由于偏度測量平均值和模式之間的差異,我們可以計算3(平均值-模式)。為了使這個數量無量綱,我們可以將其除以標準偏差,給出一種計算偏度的替代方法,而不是使用統(tǒng)計中的矩。

教育資源網_1

注意事項

如上所述,以上不是確切的關系。相反,這是一個很好的經驗法則,類似于范圍規(guī)則,它在標準偏差和范圍之間建立了近似的聯(lián)系。平均值,中位數和模式可能不完全符合上述經驗關系,但很有可能它會相當接近。