了解簡單的線性回歸以及它的工作原理

分析定量數據的基本統計方法

禮貌Colin Broug,攝影師。 ©2010年6月10日Stock.xchng

線性回歸模型用於顯示或預測兩個變量或因素之間的關係。 被預測的因素(方程解決的因素)被稱為 因變量。 用於預測因變量值的因素稱為自變量。

好的數據並不總是告訴整個故事。 回歸分析通常用於研究,因為它確定變量之間存在相關性。

相關與因果關係並不相同 。 即使是適合數據點的簡單線性回歸中的一條線也不能說明因果關係。

在簡單的線性回歸中,每個觀察值都由兩個值組成。 一個值是因變量,一個值是自變量。

簡單線性回歸模型

簡單的線性回歸模型如下所示: y =( β0 + β1 + Ε

通過數學約定,簡單線性回歸分析中涉及的兩個因素被指定為xy

描述y如何與x相關的等式稱為回歸模型 。 線性回歸模型還包含一個由Ε或希臘字母ε表示的誤差項。 誤差項用於解釋yx之間的線性關係無法解釋的y的變化性。

還有代表正在研究的人群的參數。 這些由(β0 + β1 x )表示的模型參數

簡單線性回歸模型

簡單線性回歸方程如下所示:E( y )=( β0 + β1 x )。

簡單的線性回歸方程被繪製成一條直線。

β0是回歸線的y截距。

β1是斜率。

Εy )是給定值xy的平均值或期望值。

回歸線可以顯示正線性關係,負線性關係或無關係。 如果簡單線性回歸中的圖線是平坦的(非斜率),則兩個變量之間不存在關係。 如果回歸線在曲線的y截距(軸)處與線的下端向上傾斜,並且線的上端向上延伸到圖場中,遠離x截距(軸),則存在正線性關係。 如果回歸線在曲線的y截距(軸)處與線的上端向下傾斜,並且向下延伸到圖場中的線的下端向x截距(軸)存在負線性關係。

估計的線性回歸方程

如果總體參數是已知的,則可以使用簡單線性回歸方程(如下所示)來計算已知值xy的平均值。

E( y )=( β0 + β1 x )。

然而,在實踐中,參數值是未知的,所以它們必須通過使用來自人群樣本數據來估計。 使用樣本統計來估計總體參數樣本統計量由b 0 + b 1表示。當樣本統計量代替總體參數時,估計的回歸方程就形成了。

估計的回歸方程如下所示。

ŷ )=( β0 + β1 x

ŷ )發音為帽子

估計的簡單回歸方程的圖形稱為估計回歸線。

b 0是y截距。

b 1是斜率。

ŷ )是給定值xy的估計值。

重要提示:回歸分析不用於解釋變量之間的因果關係 。 然而,回歸分析可以指示變量如何相關或者變量之間的關聯程度

在這樣做的時候,回歸分析傾向於建立顯著的關係,值得知識型研究人員仔細研究

也被稱為:雙變量回歸,回歸分析

示例: 最小二乘法使用樣本數據查找估計回歸方程的值的統計過程。 最小二乘法是由Carl Friedrich Gauss提出的,他出生於1777年,於1855年去世。最小二乘法仍被廣泛使用。

資料來源:

Anderson,DR,Sweeney,DJ和Williams,TA(2003)。 商業和經濟統計學基礎(第三版)梅森,俄亥俄州:西南部,湯普森學習。

______。 (2010年)。 解釋:回歸分析。 MIT新聞。

McIntyre,L。(1994)。 使用捲菸數據進行多重回歸介紹。 統計教育雜誌,2 (1)。

Mendenhall,W.和Sincich,T。(1992)。 工程與科學統計(第三版),紐約州紐約市:Dellen Publishing Co.

Panchenko,D。18.443應用統計,2006年秋季,第14節,簡單線性回歸。 (麻省理工學院:麻省理工學院開放式課件)