計(jì)算相關(guān)系數(shù)

查看散點(diǎn)圖時(shí)需要問(wèn)很多問(wèn)題。最常見(jiàn)的一種是想知道直線接近數(shù)據(jù)的程度。為了幫助回答這個(gè)問(wèn)題,有一個(gè)稱為相關(guān)系數(shù)的描述性統(tǒng)計(jì)量。我們將看到如何計(jì)算此統(tǒng)計(jì)信息。

The Correlation Coefficient

r表示的相關(guān)系數(shù)告訴我們散點(diǎn)圖中的數(shù)據(jù)沿直線下降的緊密程度。r的**值越接近1,線性方程描述的數(shù)據(jù)越好。如果r=1或r=-1,則數(shù)據(jù)集完全對(duì)齊。值r接近零的數(shù)據(jù)集幾乎沒(méi)有直線關(guān)系。

由于計(jì)算時(shí)間長(zhǎng),**使用計(jì)算器或統(tǒng)計(jì)軟件計(jì)算r。但是,知道計(jì)算器在計(jì)算時(shí)正在做什么總是值得的。下面是一個(gè)主要用手工計(jì)算相關(guān)系數(shù)的過(guò)程,計(jì)算器用于常規(guī)算術(shù)步驟。

計(jì)算r

的步驟

我們將首先列出計(jì)算相關(guān)系數(shù)的步驟。我們使用的數(shù)據(jù)是配對(duì)數(shù)據(jù),每對(duì)數(shù)據(jù)將用(x,y)表示健康知識(shí)我知道手抄報(bào)

  1. 我們從一些初步計(jì)算開(kāi)始。這些計(jì)算的數(shù)量將用于我們計(jì)算r:
    1. 計(jì)算x?,數(shù)據(jù)的所有第一坐標(biāo)的平均值x。
    2. 計(jì)算?,數(shù)據(jù)的所有第二坐標(biāo)的平均值
    3. y。
    4. 計(jì)算s所有樣本的標(biāo)準(zhǔn)差數(shù)據(jù)的第一個(gè)坐標(biāo)中的一個(gè)x
    5. 計(jì)算s數(shù)據(jù)的所有第二個(gè)坐標(biāo)的樣本標(biāo)準(zhǔn)偏差y。
  2. Use公式(z)=(x–x?)/s并計(jì)算每個(gè)x的標(biāo)準(zhǔn)化值。
  3. 使用公式(z)=(y–?)/s并計(jì)算每個(gè)y標(biāo)準(zhǔn)化值。
  4. 乘以相應(yīng)的標(biāo)準(zhǔn)值:(z)(z)
  5. 添加**一步的產(chǎn)品
  6. 將上一步的總和除以n–1,其中n是我們配對(duì)數(shù)據(jù)集中的點(diǎn)總數(shù)。所有這些的結(jié)果是相關(guān)系數(shù)r。

這個(gè)過(guò)程并不難,每一步都是相當(dāng)常規(guī)的,但所有這些步驟的收集都非常復(fù)雜。標(biāo)準(zhǔn)偏差的計(jì)算本身就足夠繁瑣。但是相關(guān)系數(shù)的計(jì)算不僅涉及兩個(gè)標(biāo)準(zhǔn)偏差,還涉及許多其他操作。

示例

為了確切地看到如何獲得r的值,我們看一個(gè)例子。同樣,重要的是要注意,對(duì)于實(shí)際應(yīng)用,我們希望使用計(jì)算器或統(tǒng)計(jì)軟件為我們計(jì)算r。

我們首先列出配對(duì)數(shù)據(jù):(1,1),(2,3),(4,5),(5,7)。x值的平均值,1,2,4和5的平均值是x?=3。我們也有?=4。標(biāo)準(zhǔn)差

x值為s=1.83和s=2.58。下表總結(jié)了r所需的其他計(jì)算。最右邊欄中的產(chǎn)品總和為2.969848。由于總共有四個(gè)點(diǎn),4-1=3,我們將產(chǎn)品總和除以3。這給我們一個(gè)相關(guān)系數(shù)r=2.969848/3=0.989949。

表相關(guān)系數(shù)計(jì)算示例

186 1 187188 1 189198 2 199
xyzzzz
-1.09544503-1.1618949581.272792057
3-0.547722515-0.3872983190.212132009
450.5477225150.3872983190.212132009
571.095445031.1618949581.272792057

教育資源網(wǎng)_1