許多研究都是基于對每個概率區域中不一致或缺陷數量的計算。概率區域是時間和容量的連續單位,或者是可能發生多個事件的區域。例子包括新冰箱的表面缺陷,周末酒店的投訴數量,一個月工廠的事故數量。在這些情況下,可以使用泊松概率分布來計算概率。表1描述了使用泊松分布所必需的一些特定情況的特征。
表1 泊松分布
想想在午餐時間拜訪位于大城市商業區的銀行的客戶數量。你對每分鐘到達的顧客數量感興趣。這種情況是否符合表1所示泊松分布的四個特征?
首先,事件是客戶的到來,給定的概率區域定義為午餐時間在銀行一分鐘。零,一到兩個就到了;其次,假設客戶在隨機選擇的一分鐘內到達的概率等于所有其他分鐘內到達的概率;第三,任何一分鐘一個客戶的到來,對任何一分鐘其他客戶的到來都沒有影響(比如統計獨立性);第四,隨著時間間隔變小,在給定的時間間隔內,兩個或更多客戶到達的概率接近于零。例如,兩個客戶在百分之一秒的時間間隔內到達的概率實際上是不可能的。因此,你可以用泊松分布來計算午餐時間一分鐘內到達銀行的客戶數量的概率。
為了說明泊松概率的應用,假設過去的數據顯示,平均每分鐘有3個人在午餐時間到達。為了計算一定數量的客戶在下一分鐘到達的概率,可以使用Minitab或JMP。
表2顯示了達到客戶數量的概率,范圍從0到12。例如,觀察到平均值為每分鐘3人,零客戶到達的概率為0.049787,一個客戶到達的概率為0.149361,兩個客戶到達的概率為0.224042,十二個客戶到達的概率僅為0.00055。因此,為了計算兩個或更少的客戶到達的概率,您可以將零的概率(0.049787)、一的概率(0.149361)和兩個的概率(0.224042)相加。
表2 Minitab泊松分布計算
因此,如果平均每分鐘到達的客戶數量為3人,則下一分鐘有42.319%的概率會有兩個或更少的客戶到達。
2.泊松分布特征
每次指定平均值時,都會生成泊松分布。泊松分布會左偏,但接近對稱,峰值會隨著均值的增加而在中間位置。泊松分布的一個重要特征是均值和方差相等。以到達銀行的客戶數為例,平均值和期望值為每分鐘3人,標準差為3的平方根,即每分鐘1.732個客戶。