EMA(指數(shù)平均數(shù)指標(biāo))到底是什么?

問題

假如我們現(xiàn)在有365天的溫度,要求最近N天的平均溫度值,其中 [公式] 。

加權(quán)平均數(shù)

當(dāng)N=365,加權(quán)平均數(shù)為:

[公式]

指數(shù)加權(quán)平均是一種近似求平均的方法。

指數(shù)加權(quán)平均

[公式]

  • [公式] : 約等于最近的 [公式] 天的平均溫度值;(為啥是 [公式] 后面再講)。
  • [公式] :代表的是第t天的溫度值;
  • [公式] : 可調(diào)節(jié)的超參.

例如: [公式] ,t=100, [公式] 90到100這十天的平均溫度。

舉例迭代的過程如下:

[公式]

[公式]

[公式]

[公式]

設(shè)置不同的 [公式] 會是什么樣子呢?

[公式] ,代表的是最近10天的平均溫度值,對應(yīng)下圖中的紅線.

[公式] ,代表的是最近50天的平均溫度值,對應(yīng)下圖中的綠線.

[公式] ,代表的是最近2天的平均溫度值,對應(yīng)下圖中的黃線,可以看到這時候和每天的溫度值基本就是吻合的.

我們把公式展開一下,看看這個算法是怎么作用于 [公式] 的,以 [公式] 為例。

[公式]

 

到這里我們就很清楚 [公式] 實(shí)際上是對每天溫度的加權(quán)平均,時間越近,權(quán)重越大,而且是指數(shù)式的,所以叫做指數(shù)加權(quán)平均。 假如我們以1/e為一個分界點(diǎn),認(rèn)為權(quán)重小于1/e對整個結(jié)果影響很小,權(quán)重指數(shù)衰減到這個值之后的項(xiàng)就可以忽略不計(jì)了,那當(dāng) [公式] 取值的時候,多久才可以衰減到1/e呢?

考慮以下函數(shù):

[公式]

[公式]

這個時候需要10天可以衰減到1/e

[公式]

這個時候需要50天可以衰減到1/e

所以最開始說:

[公式] :代表的是第 [公式] 天的溫度值;

應(yīng)用

  • 深度學(xué)習(xí)優(yōu)化算法中應(yīng)用。解決梯度下降算法中收斂過慢的問題。
  • CTR預(yù)估。如果最開始上線一個位置,數(shù)據(jù)量很小,LR、FTRL訓(xùn)練模型很不好搞得時候可以用MA算法;
  • 異常點(diǎn)平滑。美團(tuán)外賣的收入監(jiān)控報警系統(tǒng)中的hot-winter就是指數(shù)移動平均算法的升級。