SPSS回归分析

迴歸分析(線性迴歸分析)研究變數之間的影響關係。雖然相關分析描述分析專案之間是否存在關係,但迴歸分析研究X(自變數,通常是定量資料)如何影響Y(因變數,定量資料)。存在相關關係不一定意味著會有迴歸影響關係。

什麼是迴歸分析

迴歸分析本質上是研究X(自變數,通常是定量資料)如何影響Y(因變數,定量資料)。分析過程包括四個步驟:


步驟1:分析模型情況


- 模型擬合:R²表示Y的變異有多少可以由所有X變數解釋。例如,R² = 0.3表示所有X變數可以解釋Y的30%的變異。


- 多重共線性:VIF值小於5表示沒有多重共線性問題。


- F檢驗:用於確定至少一個X是否對Y有影響。如果顯著(標記有星號),表示至少一個X對Y有影響關係。


步驟2:分析X的顯著性


- 如果顯著(透過p值判斷),表示存在影響關係;否則,不存在影響關係。


步驟3:確定X對Y的影響方向


- 迴歸係數B值大於0表示正向影響;否則,負向影響。


步驟4:其他分析


- 比較影響的大小(比較迴歸係數B值以確定不同X變數對Y的相對影響)。


重要說明:通常,應在迴歸分析之前進行相關分析,以首先了解是否存在關係。迴歸分析研究是否存在影響關係。存在相關關係不一定意味著會有迴歸影響關係。

功能存取


1. 導航到SurveyMars系統中問卷的「分析結果」部分。


2. 點擊「SPSS分析」選項以存取分析功能。


3. 點擊「立即分析」按鈕,從可用分析方法中選擇「迴歸分析」 。


Accessing regression analysis feature from SPSS Analysis menu by clicking Analysis now button


執行迴歸分析


1. 選擇要分析的因變數(Y)。


2. 選擇要分析其對Y影響的自變數(X)。


3. 如果您想儲存殘差項用於模型驗證,可以勾選相應的核取方塊。


Setting up regression analysis with dependent Y variable and independent X variables selection


4. 點擊「確認」 按鈕以產生迴歸分析結果。


Regression analysis results table displaying coefficients, p-values, VIF values, R-squared, and F-test statistics


解釋迴歸結果


迴歸分析結果分四步解釋:


步驟1:分析模型情況


- 模型擬合(R²):R²表示Y的變異有多少可以由所有X變數解釋。例如,R² = 0.3表示所有X變數可以解釋Y的30%的變異。


- 多重共線性(VIF):VIF值小於5(嚴格小於5)表示沒有多重共線性問題。如果VIF大於10,表示模型建構不佳。


- F檢驗:用於確定至少一個X是否對Y有影響。如果F值標記有星號(*),表示顯著(p < 0.05)。如果沒有星號,表示p > 0.05。


步驟2:分析X的顯著性


- 檢查每個X變數的p值


- 如果p < 0.05(標記為*),表示存在顯著影響關係


- 如果p < 0.01(標記為**),表示存在高度顯著影響關係


- 如果p > 0.05(無星號),表示不存在顯著影響關係


步驟3:確定X對Y的影響方向


- 迴歸係數B值大於0:正向影響(隨著X增加,Y也增加)


- 迴歸係數B值小於0:負向影響(隨著X增加,Y減少)


步驟4:比較影響的大小


- 比較標準化係數(Beta值)以確定不同X變數對Y的相對影響


- 當Beta > 0時,值越大,正向影響越大


- 當Beta < 0時,值越小,負向影響越大


模型驗證


迴歸分析後,您可以驗證迴歸模型。驗證包括以下四個方面:


1. 多重共線性:


- 檢查VIF值。如果所有VIF值都小於10(嚴格小於5),表示沒有多重共線性問題,模型建構良好


- 如果VIF大於10,表示模型建構不佳


- 如果存在多重共線性,您可以使用逐步迴歸分析、嶺迴歸分析,或執行相關分析以手動刪除高度相關的專案


2. 自相關:


- 如果D-W值約為2(在1.7和2.3之間),表示沒有自相關,模型建構良好


- 如果D-W值顯著偏離2,表示存在自相關,模型建構不佳


- 當出現自相關問題時,建議檢查因變數Y資料


3. 殘差常態性:


- 在分析過程中儲存殘差項,然後使用「直方圖」直觀檢查殘差常態性


- 如果殘差在視覺上滿足常態性,表示模型建構良好


- 如果殘差常態性非常差,建議重建模型,例如對Y取對數並重建模型


4. 異質變異性:


- 使用儲存的殘差項與自變數X或因變數Y建立散點圖


- 檢查散點是否顯示明顯的模式,例如殘差項隨著X值增加而增加或減少


- 如果存在明顯模式,表示存在異質變異性,模型建構不佳


- 如果存在明顯的異質變異性,建議重建模型,例如對Y取對數並重建模型


重要說明


- 迴歸分析研究X(自變數)如何影響Y(因變數),其中X通常是定量資料,Y是定量資料


- 通常,應在迴歸分析之前進行相關分析,以首先了解是否存在關係


- 存在相關關係不一定意味著會有迴歸影響關係


- 模型驗證包括檢查多重共線性(VIF)、自相關(D-W)、殘差常態性和異質變異性


- VIF值小於5表示沒有多重共線性問題;D-W值約為2(1.7-2.3)表示沒有自相關


- 如果迴歸分析顯示各種異常,使用描述性分析、箱線圖、散點圖等檢查資料中的異常值


常見問題(FAQ)


問題1:我需要在迴歸分析之前執行相關分析嗎?


答:通常,應在迴歸分析之前進行相關分析,以首先了解是否存在關係。迴歸分析研究是否存在影響關係。存在相關關係不一定意味著會有迴歸影響關係。您也可以在迴歸分析之前使用散點圖直觀檢查資料關係。


問題2:如何比較不同自變數之間的影響大小?


答:如果自變數X已經顯示對因變數Y有顯著影響(p < 0.05),並且您想比較影響大小,可以使用標準化係數(Beta值)。當Beta > 0時,表示正向影響,值越大,影響越大。當Beta < 0時,表示負向影響,值越小,影響越大。


問題3:如果迴歸分析缺少Y(因變數)怎麼辦?


答:迴歸分析研究X對Y的影響。有時由於問卷設計問題,Y缺失(沒有設計相應的問卷專案)。建議計算所有X專案的平均值來表示Y(使用「產生變數」平均值功能)。 


問題4:為什麼單個X顯示影響但多個X一起顯示沒有影響?


答:有時當只包含一個X時,它顯示對Y有顯著影響;但當包含多個X變數時,它們顯示沒有顯著影響。這是非常正常的。當包含多個X變數時,可能存在「競爭」關係,並且可能出現多重共線性問題。研究人員應結合實際情況。通常,一次包含多個X變數更常見,相當於包含多個X變數的模型;而一次包含一個X重複進行相當於多個模型。


問題5:F值後面的括號中的兩個值代表什麼?


答:要從F值計算p值,需要兩個自由度值(df1和df2)。通常,df1等於自變數的數量;df2等於樣本量 - (自變數數量 1)。這兩個值只是標準格式所需的中間過程值,沒有其他實際意義。


問題6:簡單迴歸和多元迴歸有什麼區別?


答:當X變數的數量為1時,通常稱為簡單迴歸或單變數迴歸。當X變數的數量超過1時,稱為多元迴歸。這種命名在線性迴歸和邏輯迴歸中都是一致的。


這篇文章有多大幫助?