良好的調查研究設計尋求減少採樣誤差
什麼是置信區間?
置信區間是指研究人員如果可以詢問某個特定研究問題 ,例如目標人群的每個成員,並獲得樣本成員在調查中給出的相同答案,就會遇到的誤差範圍。
例如,如果研究人員使用4的置信區間並且60%的調查樣本中的參與者回答“會推薦給朋友”,他可以確定在整個目標人群中有54%到64%的成員會當被問及同樣的問題時,還會說“會推薦給朋友”。 在這種情況下,置信區間為+/- 4。
什麼是置信度?
置信水平表達了研究人員對樣本數據的可信度 。 置信水平以百分比表示,表示目標人口百分比給出回答的頻率在置信區間內。 最常用的置信度是95%。 一個相關的概念被稱為統計顯著性。
研究人員對他的樣本真實代表目標人群的概率的信心受到許多因素的影響。
研究人員對其研究設計和實施的信心 - 以及對其局限性的認識 - 主要基於三個重要變量:樣本量,反應頻率和人口規模。 研究人員一直認為在研究計劃階段必須仔細考慮這些變量。
- 樣本量一般而言,較大的樣本可以提供真實反映目標人群的數據。 寬可信區間表示對數據的置信度較低,因為存在較大的錯誤餘量 。 寬泛的置信區間就像對沖你的賭注。 儘管置信區間和样本量之間存在一定的關係,但它不是線性關係 。 研究人員不能通過加倍樣本量來降低一半的置信水平。
- 響應頻率樣本數據反映目標人群的準確性還取決於以特定方式 給出特定答案或作出答复的答复者的百分比。 提供特定答案的受訪者數量越多,表示“非常高興”,研究人員就可以對此作出回應。 正常曲線中間區域的百分比會有一些變化。 也就是說,如果研究人員有50%的信心, 目標人群的成員會像樣本人群中的成員一樣(在置信區間內)做出反應,那麼這個50%的水平可能會有一些變化。
應該記住, 異常值(正態曲線的遠端或尾部的數據)更可能以人口中的相同比率出現,與樣本中的相同 - 這裡的變異性較小,因為頻率較低。 (考慮一下Galton Box中的球在太平洋科學中心的展覽中如何往往堆積在中間?只有少數球會反彈到尾巴上。)因此, 對極端答案的頻率很自信。
- 除非研究人員正在與他或她知道的非常小的人群(例如足夠小以便研究人員可以識別所有人員),否則人口規模並不是樣本量的重要因素。
Creative Research Systems指出:
概率的數學證明人口的規模是不相關的,除非樣本的規模超過您正在檢查的總人口的百分之幾。 這意味著500人的樣本在審查 1500萬人的意見時同樣有用,因為它將是一個100,000人的城市。
生成具有代表性的樣本可能是一個代價高昂並且耗時的過程。 研究人員總是需要在他們想獲得的信心水平或他們需要達到的準確程度以及他們能夠承受的信心水平之間進行權衡 。
定性調查研究中的樣本量
定性研究本質上是探索性或描述性的,並不關注數字或度量。 但對定性調查研究中抽樣誤差的擔憂仍然有效。 作為一般規則,如果樣本是目標宇宙的代表,那麼從研究中產生的主題或模式將反映研究人員感興趣的更大的人口。 如果樣本既具有代表性,又由大部分目標人口組成,那麼從該樣本導出的數據的準確性的置信度就會很高。
確定調查研究中的樣本量
在確定樣本量時,不同的規則適用於定量研究和定性研究。 一般來說,要對定性調查研究產生的數據充滿信心,研究人員需要清楚地了解數據如何使用。 這些數據可能構成描述性敘述(如案例研究或某些民族志研究)的基礎,或者可能以探索性方式發現相關變量,以後可能會在定量研究中對相關性進行測試。
定量調查研究中的樣本量
定量研究通常涉及目標市場的細分市場或亞組之間的比較。 因為定量研究是數字驅動的,所以確定一個舒適的樣本容量可能相當容易 - 對於研究中的每個重要群體或細分群體,研究人員都希望調查100個參與者。 這個數字是一個建議,而不是絕對的。 市場研究員會考慮一些相關變量來確定調查研究中樣本的大小。
在進行調查市場調查時,目標是從樣本中推斷目標宇宙可能是真實的。 樣本提供可以觀察或已知的數據。 根據這些觀察到的或已知的數據,研究人員可以估計在目標人群中可以找到未知值或參數的程度。
定量調查研究基於正常對稱曲線的概念,在研究人員的心目中,它代表目標宇宙 - 研究人員必須估算的人群而不是實際知道的參數。 代表性樣本允許研究人員根據樣本數據計算可能包含未知值或感興趣參數的估計值範圍 。 此估計的值範圍表示正常曲線上的面積,通常以小數或百分比表示。
正態曲線和概率
正常的對稱曲線是概率的可視表達。 讓我們看看一個簡單的啟發式:科學中心的一項活動讓大量的球落在兩塊壓克力板之間,一次一塊。 每個球從顯示器頂部的同一個開口落下,然後落在任何垂直平行分隔器之間,一旦它們休息,它們就會分離出一堆球。 幾個小時後,球形成了正常曲線的形狀。 隨著每個新引入的球擊中大量首先到達的球,曲線稍微改變一點。 但總體而言,對稱曲線是明顯的,並且自然發生,與科學中心觀察員或工作人員的任何行動無關。 球形成的彎曲形狀反映了大多數球落入中心並停留在那裡的概率。 更少的球會使它進入曲線的盡頭 - 有些球不可避免地會出現,但它們數量不多。
這條正常曲線與樣本的概念相似。 每當顯示器被清空並且球再次被允許落入高爾頓盒時,球堆疊的配置將僅有點不同。 但隨著時間的推移,曲線的形狀不會發生太大的變化,並且這種模式也會成立。