隨著樣本量的增加,無論個體值組成的總體的分布形狀如何,均值的抽樣分布都可以用正態分布來表示。
圖1顯示了三個不同群體平均值的抽樣分布。對于每個群體,樣本量有三種可能性:3、5和30。樣本平均值的樣本分布如圖所示:
圖l 對不同總體的均值的抽樣分布
在圖1中,描述了正態分布平均值的樣本分布。當總體為正態分布時,樣本均值的抽樣分布是正態的,與樣本大小無關。隨著樣本量的增加,樣本間的均值差會變小。原因是隨著樣本量的增加,異常個體值對單個樣本平均值的影響變小。
第1b部分描述了均勻分布類型的總體抽樣分布。當樣本量n為2時,分布存在峰值或中心趨勢,中心附近樣本平均值較多。當樣本量n為5時,抽樣分布呈鐘形,接近正態分布。當樣本量n為30時,抽樣分布將非常接近正態分布。一般來說,樣本空間越大,抽樣分布越接近正態分布。與上面的例子一樣,每個樣本分布的平均值等于整個總體的平均值,并且隨著樣本空間的增加,差異將變得更小。
圖1c描繪了右偏斜指數分布的采樣分布。當n等于2時,抽樣分布仍明顯向右偏斜,但偏斜度小于總體分布。當n等于5時,采樣分布幾乎對稱,只有輕微的右偏。當n等于30時,抽樣分布接近正態分布。抽樣分布的均值等于總體均值,變異程度隨著樣本空間的增大而減小。
這些統計分布中呈現的結果使天行健管理咨詢公司能夠得出圖2中列出的結論:
圖2 均值的抽樣分布
2.比例抽樣分布
最簡單的質量數據是數據中的任何變量都可以分為兩類的數據。例如,每一種發生的概率都服從二項分布。然而,當平均事件數和平均不發生事件數分別至少為5時,我們可以用正態分布來估計二項式分布。在大多數情況下,當我們從樣本中推斷群體的特征時,樣本的大小通常不足以滿足正態分布估計。