分析定量數據的基本統計方法
線性回歸模型用於顯示或預測兩個變量或因素之間的關係。 被預測的因素(方程解決的因素)被稱為 因變量。 用於預測因變量值的因素稱為自變量。
好的數據並不總是告訴整個故事。 回歸分析通常用於研究,因為它確定變量之間存在相關性。
但相關與因果關係並不相同 。 即使是適合數據點的簡單線性回歸中的一條線也不能說明因果關係。
在簡單的線性回歸中,每個觀察值都由兩個值組成。 一個值是因變量,一個值是自變量。
- 簡單線性回歸分析回歸分析的最簡單形式使用因變量和一個獨立變量。 在這個簡單的模型中 ,一條直線近似了因變量和自變量之間的關係。
- 多元回歸分析當回歸分析中使用兩個或多個自變量時,該模型不再是簡單的線性變量。
簡單線性回歸模型
簡單的線性回歸模型如下所示: y =( β0 + β1 + Ε
通過數學約定,簡單線性回歸分析中涉及的兩個因素被指定為x和y 。
描述y如何與x相關的等式稱為回歸模型 。 線性回歸模型還包含一個由Ε或希臘字母ε表示的誤差項。 誤差項用於解釋y和x之間的線性關係無法解釋的y的變化性。
還有代表正在研究的人群的參數。 這些由(β0 + β1 x )表示的模型參數 。
簡單線性回歸模型
簡單線性回歸方程如下所示:E( y )=( β0 + β1 x )。
簡單的線性回歸方程被繪製成一條直線。
( β0是回歸線的y截距。
β1是斜率。
Ε ( y )是給定值x的y的平均值或期望值。
回歸線可以顯示正線性關係,負線性關係或無關係。 如果簡單線性回歸中的圖線是平坦的(非斜率),則兩個變量之間不存在關係。 如果回歸線在曲線的y截距(軸)處與線的下端向上傾斜,並且線的上端向上延伸到圖場中,遠離x截距(軸),則存在正線性關係。 如果回歸線在曲線的y截距(軸)處與線的上端向下傾斜,並且向下延伸到圖場中的線的下端向x截距(軸)存在負線性關係。
估計的線性回歸方程
如果總體參數是已知的,則可以使用簡單線性回歸方程(如下所示)來計算已知值x的y的平均值。
E( y )=( β0 + β1 x )。
然而,在實踐中,參數值是未知的,所以它們必須通過使用來自人群樣本的數據來估計。 使用樣本統計來估計總體參數 。 樣本統計量由b 0 + b 1表示。當樣本統計量代替總體參數時,估計的回歸方程就形成了。
估計的回歸方程如下所示。
( ŷ )=( β0 + β1 x
( ŷ )發音為帽子 。
估計的簡單回歸方程的圖形稱為估計回歸線。
b 0是y截距。
b 1是斜率。
ŷ )是給定值x的y的估計值。
重要提示:回歸分析不用於解釋變量之間的因果關係 。 然而,回歸分析可以指示變量如何相關或者變量之間的關聯程度 。
在這樣做的時候,回歸分析傾向於建立顯著的關係,值得知識型研究人員仔細研究 。
也被稱為:雙變量回歸,回歸分析
示例: 最小二乘法是使用樣本數據查找估計回歸方程的值的統計過程。 最小二乘法是由Carl Friedrich Gauss提出的,他出生於1777年,於1855年去世。最小二乘法仍被廣泛使用。
資料來源:
Anderson,DR,Sweeney,DJ和Williams,TA(2003)。 商業和經濟統計學基礎(第三版)梅森,俄亥俄州:西南部,湯普森學習。
______。 (2010年)。 解釋:回歸分析。 MIT新聞。
McIntyre,L。(1994)。 使用捲菸數據進行多重回歸介紹。 統計教育雜誌,2 (1)。
Mendenhall,W.和Sincich,T。(1992)。 工程與科學統計(第三版),紐約州紐約市:Dellen Publishing Co.
Panchenko,D。18.443應用統計,2006年秋季,第14節,簡單線性回歸。 (麻省理工學院:麻省理工學院開放式課件)