所有關於分層隨機抽樣
什麼是分層隨機抽樣?
樣本是較大人口的微型代表。
樣本可以非正式或正式確定。 但是,根據某些科學方法 系統開發的樣本通常被認為對更廣泛群體的推廣更有用。
分層意味著什麼?
分層樣本包括被認為在重要方面不同的同質子群。 這些同質子群的集合被稱為分層。 這種抽樣程序的方法使人口可以分為均質的小組,從中可以選擇簡單的隨機樣本。
為什麼分層樣本有用?
分層隨機抽樣的目的是從不同亞組中選擇參與者,這些亞組被認為與將要進行的研究有關。 例如,研究結果可能受到學科屬性的影響 ,如年齡,性別,工作經驗水平,種族和族群,經濟狀況,受教育程度等等。
分層樣本的構建使得這些潛在的影響特徵可以合理地假設為反映總人口中這些特徵的模式。 通過這種方式,樣本反映了從中獲取的人口,但樣本不能說是代表較大的人口 。
請記住,分層樣本成員的選擇不是一個隨機過程。 也就是說,一旦建立了地層,就使用簡單的隨機抽樣來為每個地層選擇樣本的成員。
概率是什麼意思?
分層隨機樣本是概率的,因為用於選擇樣本群體的每種方法都提供了合理可靠的方式來估計樣本群體對選擇樣本的較大(宇宙)群體的代表程度。 換句話說, 概率樣本允許研究人員估計樣本選擇的確切或不代表樣本被抽取的較大群體的機率 。
例子
當對同質亞群和整個較大樣本群體之間的差異感興趣時,採用分層隨機抽樣方法。
假設一群商業客戶可分為三組:Gen-Xers,Gen-Yers(千禧年)和嬰兒潮一代。 此外,我們有理由相信,Gen-Xers和Gen-Yers都是整體商業客戶中相對較小的少數群體。 Gen-Xers約佔客戶總人口的5%,Gen-Yers約佔客戶總數的10%。
如果我們使用10%的抽樣比例,100個成員(n = 100)的簡單隨機樣本可能會生成5個Gen-Xers和10個Gen-Yers。 只有偶然才有可能獲得更少的Gen-Xers和更少的Gen-Yers。 分層可能會產生更具代表性的結果。 假設我們想每組至少有25人。 如果我們仍然抽樣100人(n = 100),那麼我們可以抽樣25名Gen-Xer,25名Gen-Yers和50名嬰兒潮一代。
我們知道,百分之十的人口是千禧一代或一代人(或約100名客戶),隨機抽樣的25名客戶將提供25/100或25%的階層內抽樣比例,我們也知道5% 50名不是嬰兒潮一代的客戶是Gen-Xers,這意味著階層分數將是25/50或50%。
因此,50位Gen-Xers加上100位Gen-Yers總計150位客戶。 由於客戶總人數為1000人,因此我們將Gen-Xers加上Gen-Yers(總共150位客戶)減去850名客戶,他們是嬰兒潮一代。 嬰兒潮一代的階層抽樣比例為50/850或約5.88%。
有兩件事情是顯而易見的:(1)這三組在整個人群中更為同質 。 這意味著方差較小,這為提高統計精度提供了機會。 (2)由於樣本已經分層,所以每個組中都有足夠的成員能夠進行有意義的小組推理 。
分層抽樣可能優於簡單隨機抽樣,因為當代表總體人口和代表人口的關鍵子群體時尤其如此,尤其是當子群體非常小但以重要方式區分時。 通過使用分層抽樣方法,研究人員可以有效地確保在討論研究結果時可以區分亞組 。