什么是直方圖?
直方圖是一種在統(tǒng)計中具有廣泛應用的圖形。直方圖通過指示位于值范圍內的數據點的數量來提供數值數據的視覺解釋。這些值的范圍被稱為類或bin。屬于每個類別的數據的頻率通過使用條形圖來描述。條形圖越高,該區(qū)間中數據值的頻率越高。
直方圖與條形圖
乍一看,直方圖看起來與條形圖非常相似。兩個圖都使用垂直條來表示數據。條的高度對應于類中數據量的相對頻率。酒吧越高,數據的頻率越高。酒吧越低,數據頻率越低。但看起來可能是欺騙性的。正是在這里,兩種圖之間的相似性結束了。
這些圖形不同的原因與數據的測量水平有關。一方面睡前小知識,條形圖用于名義測量水平的數據。條形圖測量分類數據的頻率,條形圖的類別是這些類別。另一方面,直方圖用于至少在序數測量水平的數據。直方圖的類是值的范圍。
條形圖和直方圖之間的另一個關鍵區(qū)別與條形圖的排序有關。在條形圖中,通常的做法是按照降低高度的順序重新排列條形圖。但是,直方圖中的條無法重新排列。它們必須按類發(fā)生的順序顯示。
直方圖示例
上圖顯示了直方圖。假設翻轉四個硬幣并記錄結果。使用適當的二項式分布表或二項式公式的直接計算顯示了概率沒有顯示頭部是1/16,一個頭部顯示的概率是4/16。兩個頭的概率是6/16。三個頭的概率是4/16。四個頭的概率是1/16。
我們總共構建了五個類,每個類的寬度為1。這些類對應于可能的頭數:零,一,二,三或四。在每個類的上方,我們繪制一個垂直條或矩形。這些條的高度對應于我們翻轉四個硬幣并計數頭部的概率實驗中提到的概率。
直方圖和概率
上述示例不僅演示了直方圖的構造,而且還表明離散概率分布可以用直方圖表示。實際上,離散概率分布可以用直方圖表示。
為了構建表示概率分布的直方圖,我們首先選擇類。這些應該是概率實驗的結果。每個類的寬度應該是一個單位。直方圖條的高度是每個結果的概率。通過以這種方式構造的直方圖,條的面積也是概率。
由于這種直方圖給了我們概率,它受到幾個條件的影響。一個規(guī)定是只有非負數可以用于比例尺,它給我們給定直方圖條的高度。第二個條件是,由于概率等于面積,所以條的所有面積必須加起來總共一個,相當于****。
直方圖和其他應用程序
直方圖中的條不需要是概率。直方圖在概率以外的領域很有用。無論何時我們希望比較定量數據的出現頻率,直方圖都可以用來描述我們的data集。