通過圖表或數學方法,對數據資料進行整理分析,并對數據的分布狀態、數字特征和隨機變量之間關系進行估計和描述的方法。
透過對數據資料的圖像化處理,可將資料摘要變為圖表,以直觀了解整體資料分布的情況。通常會使用頻數分布表與圖示法,如多邊圖、直方圖、餅圖、散點圖等。
研究者也可以透過分析數據資料,以了解各變量內的觀察值集中與分散的情況。運用如集中量數,如平均數、中位數、眾數、幾何平均數、調和平均數。與變異量數,如全距、平均差、標準差、相對差、四分差。
為了表示測量數據與正態分布偏離的情況,會使用畸變、峰度這兩種統計數據;為了解個別觀察值在整體中所占的位置,會需要將觀察值轉換為相對量數,如百分等級、標準分數、四分位數等。
案例1:數據異常值識別
案例2:關于年齡的數據族分類
例:2005年拉丁美洲584樣本的兒童街頭工人和231傷殘病例的統計特征(包含最大值最小值、均值和標準差)