外推和插值的區(qū)別

外推和插值都用于基于其他觀察來估計(jì)變量的假設(shè)值。根據(jù)數(shù)據(jù)中觀察到的總體趨勢(shì),有多種插值和外推方法。這兩種方法的名稱非常相似。我們將檢查它們之間的差異。

前綴

為了說明外推和插值之間的區(qū)別,我們需要看看前綴“extra”和“inter”。前綴“extra”表示“outside”或“addition”。前綴“inter”表示“in between”或“between”。只知道這些含義(來自拉丁語的原文)對(duì)于區(qū)分這兩種方法有很長(zhǎng)的路要走。

設(shè)置

對(duì)于這兩種方法,我們假設(shè)一些事情。我們已經(jīng)確定了一個(gè)自變量和一個(gè)因變量。通過采樣或數(shù)據(jù)收集,我們有許多這些變量的配對(duì)。我們還假設(shè)我們已經(jīng)為我們的數(shù)據(jù)制定了一個(gè)模型。這可能是最適合的最小二乘線,也可能是近似于我們數(shù)據(jù)的其他類型的曲線。無論如何,我們有一個(gè)函數(shù)將自變量與因變量聯(lián)系起來。

目標(biāo)不僅僅是模型本身,我們通常希望使用我們的模型進(jìn)行預(yù)測(cè)。更具體地說,給定一個(gè)自變量,相應(yīng)因變量的預(yù)測(cè)值將是多少?我們?yōu)樽宰兞枯斎氲闹祵Q定我們是使用外推還是插值。

插值

我們可以使用我們的函數(shù)來預(yù)測(cè)數(shù)據(jù)中自變量的因變量的值。在這種情況下,我們正在執(zhí)行插值。

假設(shè)x介于0和10之間的數(shù)據(jù)用于生成回歸線y=2x+5。我們可以使用此**擬合線來估計(jì)對(duì)應(yīng)于x=6的y值。只需將此值插入我們的等式中,我們就可以看到y=2(6)+5=17。因?yàn)槲覀兊?em>x值在用于使線最適合的值范圍內(nèi),所以這是插值的科學(xué)小知識(shí)短一點(diǎn)一個(gè)例子。

外推

我們可以使用我們的函數(shù)來預(yù)測(cè)數(shù)據(jù)范圍之外的自變量的因變量的值。在這種情況下,我們正在進(jìn)行外推。

如前所述,假設(shè)x在0和10之間的數(shù)據(jù)用于產(chǎn)生回歸線y=2x+5。我們可以使用這條**擬合線來估計(jì)對(duì)應(yīng)于x=20的y值。只需將此值插入我們的等式中,我們就可以看到y=2(20)+5=45。因?yàn)槲覀兊?em>x值不在用于制作**擬合線的值范圍之內(nèi),所以這是外推的一個(gè)例子。

小心

在這兩種方法中,插值是**。這是因?yàn)槲覀兏锌赡塬@得有效的估計(jì)。當(dāng)我們使用外推時(shí),我們假設(shè)我們觀察到的趨勢(shì)繼續(xù)在我們用來形成模型的范圍之外x的值。情況可能并非如此,因此在使用外推技術(shù)時(shí)必須非常小心。