在社交媒體研究中避免樣本的這些偏見錯誤

如何提高社交媒體樣本的質量

目前進行的社交媒體研究受到非參與性偏見的影響。 存在許多類型的非參與性偏見,每種類型都有可能影響研究結果的可靠性 - 往往以隱藏或未知的方式。 事實上,研究表明,那些難以接觸的研究參與者需要多方努力來聯繫他們,這與其他受訪者有很大不同。

這些差異見於年齡,性別,婚姻狀況,社會經濟地位,健康狀況和兒童人數。

反應速度

研究結束時的數據包括樣本中所有成員的數據被稱為回复率 。 雖然這個概念在結構化調查或一系列訪談中很明顯,但在社交媒體研究中更加模糊。 然而,社交媒體研究的重要性不亞於其他類型的定性研究 。 答复率由完成調查的人數或同意接受調查的人數除以完成原始抽樣工作的總人數。 總人數必須包括未成功聯繫或拒絕參與研究的人員。

泛化問題

不管數據如何收集, 高回應率的重要性都不足以強調。

當樣本的響應率較低時,不可能真實地產生較大的人口。 隨著應答率下降,樣本偏差會增加。 在基於媒體的調查中,當返回率降至樣本的20%或30%時,該組參與者與整體抽樣人群幾乎沒有相似之處。

人們返回郵件調查或同意參與電話調查的趨勢與參與社交媒體網絡的人一樣:即主題(或產品或服務,視情況而定是)。

樣本大小

較小的樣本比較大的樣本具有更大的抽樣誤差。 考慮到樣本數據提供了較大人口屬性的估計值。 從抽樣框中抽取的每個樣本都提供了對較大人口的單獨估計。 理論上,對於每個問題,每個樣本可能會有不同的回應模式。 隨著時間的推移,從抽樣框中抽取足夠的樣本,真實模式將圍繞更大群體的實際(真實)模式進行收斂。

誤差範圍

抽樣誤差描述了從較大群體中抽取的任何樣本的估計精度。 抽樣誤差以與置信度水平相關的誤差幅度表示,這是一個統計量度 。 例如,在總統偏好民意調查中,該報告可能表明,在位者被64%的選民青睞。 誤差幅度為正負3分,置信度為95%。

換句話說,如果民意調查再次以100個不同的選民樣本進行,100名選民中有95名選民表示,現任選民中有61%至67%的選民青睞。 也就是說,61%的選民+ 3%或-3%。

關於樣本量的決定

隨著樣本量的增加,與採樣有關的誤差幅度也隨之下降,但僅限於某個點。 當樣本數量達到1000到2000人時,誤差幅度足夠小,以考慮更大的樣本(不是一個具有成本效益的選擇 )。 當小群體是較大群體的一部分時,較大的樣本量可能是合理的,因為每個小群體的誤差範圍將根據小群體中的人數而變化。 例如,如果給定1000個社交媒體網絡成員,誤差率等於1%到3個百分點之間,95%的置信區間,那麼對該社交媒體網絡的一個子群體的分析 - 比如停留在家中 - 媽媽的數量約為100--會有更高的誤差約4至10點。

衡量樣本充分性

通常根據所使用的選擇程序而不是最終大小或組成來評估樣品。 這是基本因素,因為在大多數情況下,不可能準確地衡量樣本代表更大群體的代表性 。 使用統計程序是因為它們允許方便且基本可靠的估計。 在開始時建立一個合理的置信區間和誤差範圍,使研究人員能夠關注變量,如響應率和足夠的抽樣框架。