SPSS回归分析
迴歸分析(線性迴歸分析)研究變數之間的影響關係。雖然相關分析描述分析專案之間是否存在關係,但迴歸分析研究X(自變數,通常是定量資料)如何影響Y(因變數,定量資料)。存在相關關係不一定意味著會有迴歸影響關係。
什麼是迴歸分析
迴歸分析本質上是研究X(自變數,通常是定量資料)如何影響Y(因變數,定量資料)。分析過程包括四個步驟:
步驟1:分析模型情況
- 模型擬合:R²表示Y的變異有多少可以由所有X變數解釋。例如,R² = 0.3表示所有X變數可以解釋Y的30%的變異。
- 多重共線性:VIF值小於5表示沒有多重共線性問題。
- F檢驗:用於確定至少一個X是否對Y有影響。如果顯著(標記有星號),表示至少一個X對Y有影響關係。
步驟2:分析X的顯著性
- 如果顯著(透過p值判斷),表示存在影響關係;否則,不存在影響關係。
步驟3:確定X對Y的影響方向
- 迴歸係數B值大於0表示正向影響;否則,負向影響。
步驟4:其他分析
- 比較影響的大小(比較迴歸係數B值以確定不同X變數對Y的相對影響)。
重要說明:通常,應在迴歸分析之前進行相關分析,以首先了解是否存在關係。迴歸分析研究是否存在影響關係。存在相關關係不一定意味著會有迴歸影響關係。
功能存取
1. 導航到SurveyMars系統中問卷的「分析結果」部分。
2. 點擊「SPSS分析」選項以存取分析功能。
3. 點擊「立即分析」按鈕,從可用分析方法中選擇「迴歸分析」 。

執行迴歸分析
1. 選擇要分析的因變數(Y)。
2. 選擇要分析其對Y影響的自變數(X)。
3. 如果您想儲存殘差項用於模型驗證,可以勾選相應的核取方塊。

4. 點擊「確認」 按鈕以產生迴歸分析結果。

解釋迴歸結果
迴歸分析結果分四步解釋:
步驟1:分析模型情況
- 模型擬合(R²):R²表示Y的變異有多少可以由所有X變數解釋。例如,R² = 0.3表示所有X變數可以解釋Y的30%的變異。
- 多重共線性(VIF):VIF值小於5(嚴格小於5)表示沒有多重共線性問題。如果VIF大於10,表示模型建構不佳。
- F檢驗:用於確定至少一個X是否對Y有影響。如果F值標記有星號(*),表示顯著(p < 0.05)。如果沒有星號,表示p > 0.05。
步驟2:分析X的顯著性
- 檢查每個X變數的p值
- 如果p < 0.05(標記為*),表示存在顯著影響關係
- 如果p < 0.01(標記為**),表示存在高度顯著影響關係
- 如果p > 0.05(無星號),表示不存在顯著影響關係
步驟3:確定X對Y的影響方向
- 迴歸係數B值大於0:正向影響(隨著X增加,Y也增加)
- 迴歸係數B值小於0:負向影響(隨著X增加,Y減少)
步驟4:比較影響的大小
- 比較標準化係數(Beta值)以確定不同X變數對Y的相對影響
- 當Beta > 0時,值越大,正向影響越大
- 當Beta < 0時,值越小,負向影響越大
模型驗證
迴歸分析後,您可以驗證迴歸模型。驗證包括以下四個方面:
1. 多重共線性:
- 檢查VIF值。如果所有VIF值都小於10(嚴格小於5),表示沒有多重共線性問題,模型建構良好
- 如果VIF大於10,表示模型建構不佳
- 如果存在多重共線性,您可以使用逐步迴歸分析、嶺迴歸分析,或執行相關分析以手動刪除高度相關的專案
2. 自相關:
- 如果D-W值約為2(在1.7和2.3之間),表示沒有自相關,模型建構良好
- 如果D-W值顯著偏離2,表示存在自相關,模型建構不佳
- 當出現自相關問題時,建議檢查因變數Y資料
3. 殘差常態性:
- 在分析過程中儲存殘差項,然後使用「直方圖」直觀檢查殘差常態性
- 如果殘差在視覺上滿足常態性,表示模型建構良好
- 如果殘差常態性非常差,建議重建模型,例如對Y取對數並重建模型
4. 異質變異性:
- 使用儲存的殘差項與自變數X或因變數Y建立散點圖
- 檢查散點是否顯示明顯的模式,例如殘差項隨著X值增加而增加或減少
- 如果存在明顯模式,表示存在異質變異性,模型建構不佳
- 如果存在明顯的異質變異性,建議重建模型,例如對Y取對數並重建模型
重要說明
- 迴歸分析研究X(自變數)如何影響Y(因變數),其中X通常是定量資料,Y是定量資料
- 通常,應在迴歸分析之前進行相關分析,以首先了解是否存在關係
- 存在相關關係不一定意味著會有迴歸影響關係
- 模型驗證包括檢查多重共線性(VIF)、自相關(D-W)、殘差常態性和異質變異性
- VIF值小於5表示沒有多重共線性問題;D-W值約為2(1.7-2.3)表示沒有自相關
- 如果迴歸分析顯示各種異常,使用描述性分析、箱線圖、散點圖等檢查資料中的異常值
常見問題(FAQ)
問題1:我需要在迴歸分析之前執行相關分析嗎?
答:通常,應在迴歸分析之前進行相關分析,以首先了解是否存在關係。迴歸分析研究是否存在影響關係。存在相關關係不一定意味著會有迴歸影響關係。您也可以在迴歸分析之前使用散點圖直觀檢查資料關係。
問題2:如何比較不同自變數之間的影響大小?
答:如果自變數X已經顯示對因變數Y有顯著影響(p < 0.05),並且您想比較影響大小,可以使用標準化係數(Beta值)。當Beta > 0時,表示正向影響,值越大,影響越大。當Beta < 0時,表示負向影響,值越小,影響越大。
問題3:如果迴歸分析缺少Y(因變數)怎麼辦?
答:迴歸分析研究X對Y的影響。有時由於問卷設計問題,Y缺失(沒有設計相應的問卷專案)。建議計算所有X專案的平均值來表示Y(使用「產生變數」平均值功能)。
問題4:為什麼單個X顯示影響但多個X一起顯示沒有影響?
答:有時當只包含一個X時,它顯示對Y有顯著影響;但當包含多個X變數時,它們顯示沒有顯著影響。這是非常正常的。當包含多個X變數時,可能存在「競爭」關係,並且可能出現多重共線性問題。研究人員應結合實際情況。通常,一次包含多個X變數更常見,相當於包含多個X變數的模型;而一次包含一個X重複進行相當於多個模型。
問題5:F值後面的括號中的兩個值代表什麼?
答:要從F值計算p值,需要兩個自由度值(df1和df2)。通常,df1等於自變數的數量;df2等於樣本量 - (自變數數量 1)。這兩個值只是標準格式所需的中間過程值,沒有其他實際意義。
問題6:簡單迴歸和多元迴歸有什麼區別?
答:當X變數的數量為1時,通常稱為簡單迴歸或單變數迴歸。當X變數的數量超過1時,稱為多元迴歸。這種命名在線性迴歸和邏輯迴歸中都是一致的。