總體:也被稱為母體,是研究對象的全體。如對某一定固定時間段和固定地點的單位、項目、服務、居民等的調查。
抽樣框:是總體中全部單位的物理目錄。
差距(gap):總體中的單位與抽樣框中的單位的差別。
如果縫隙中的單位分布與采樣盒中的單位分布相同,那么縫隙就沒有問題。但是,如果間隙中的單位分布與取樣盒中的單位分布不同,那么取樣盒的分析就會出現(xiàn)系統(tǒng)偏差。例如,如果18歲以上紐約城市居民的抽樣框架是選民登記名單,而名單上18歲及以上人口的分布(抽樣框架)與不在名單上的人口分布(gap)不同,那么對名單上選民的統(tǒng)計分析就可能包含偏差。這種差異可能會有一些影響。例如,進行一項調查以確定對移民的態(tài)度,但選民登記名單不包括尚未成為公民的居民。
樣本是總體的一部分,被選擇用來收集信息,然后為描述總體提供依據(jù)。與一般普查不同,統(tǒng)計抽樣程序側重于收集一般人口中的一小部分數(shù)據(jù)。例如,從一個由10000個應收賬款組成的數(shù)據(jù)列表或抽樣框中,選取50個應收賬款組成樣本。最終樣本應提供可用信息,用于估計整個采樣框架的特征。
使用抽樣調查有四個原因,如下表所示:
樣本有兩種類型:不等概率樣本和等概率樣本。
在不等概率樣本中,項目和個體的選擇不依賴于抽樣框。因為不等概率樣本不按抽樣框選擇單位,所以選擇概率是未知的(比如在某些情況下,被測對象有自我選擇行為)。
對于非等概率樣本,統(tǒng)計推斷理論不能適用于樣本數(shù)據(jù)。例如,許多公司通過要求訪問其網(wǎng)站的訪問者填寫電子調查表并提交來進行調查。來自調查的回答可以提供大量的數(shù)據(jù),但是因為樣本包括自選的網(wǎng)絡沖浪者,所以沒有抽樣框。通常情況下,基于專家的意見(判斷樣本),我們選擇非等概率樣本(便利樣本)是為了方便,或者是因為人們希望樣本中的某些項目、單位或人達到預定的比例(配額樣本)。非等概率樣本都包含未知程度的偏差。出現(xiàn)偏差是因為沒有使用取樣盒,然后項目或人的分類可能會系統(tǒng)性地否定樣本的代表性(缺口)。
非等概率樣本具有方便、快速和低成本的潛在優(yōu)勢。然而,它們也有兩個主要缺點:潛在的選擇偏差和由此產(chǎn)生的結果缺乏普遍性。這些缺點遠遠大于優(yōu)點。所以,非等概率抽樣法只能用在你想以較低的成本做一個粗略的估計,或者在小規(guī)模的初始研究或試點研究之后會有更嚴格的調查的時候。
盡可能使用等概率抽樣,因為統(tǒng)計推斷可以從一個等概率樣本中得出。
在等概率抽樣中,項目或個體是從抽樣框中選出的,因此,群體中的單個個體被選中的概率是已知的。
四種最常用的等概率抽樣類型是簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣和整群抽樣。這些采樣方法在成本、準確性和復雜性方面各不相同。
天行健管理咨詢公司將在下一篇文章中詳細介紹這四種等概率抽樣類型。請注意。