SPSS回归分析

回归分析(线性回归分析)研究变量之间的影响关系。虽然相关分析描述分析项目之间是否存在关系,但回归分析研究X(自变量,通常是定量数据)如何影响Y(因变量,定量数据)。存在相关关系不一定意味着会有回归影响关系。

什么是回归分析

回归分析本质上是研究X(自变量,通常是定量数据)如何影响Y(因变量,定量数据)。分析过程包括四个步骤:


步骤1:分析模型情况


- 模型拟合:R²表示Y的变异有多少可以由所有X变量解释。例如,R² = 0.3表示所有X变量可以解释Y的30%的变异。


- 多重共线性:VIF值小于5表示没有多重共线性问题。


- F检验:用于确定至少一个X是否对Y有影响。如果显著(标记有星号),表示至少一个X对Y有影响关系。


步骤2:分析X的显著性


- 如果显著(通过p值判断),表示存在影响关系;否则,不存在影响关系。


步骤3:确定X对Y的影响方向


- 回归系数B值大于0表示正向影响;否则,负向影响。


步骤4:其他分析


- 比较影响的大小(比较回归系数B值以确定不同X变量对Y的相对影响)。


重要说明:通常,应在回归分析之前进行相关分析,以首先了解是否存在关系。回归分析研究是否存在影响关系。存在相关关系不一定意味着会有回归影响关系。

功能访问


1. 导航到SurveyMars系统中问卷的"分析结果"部分。


2. 点击"SPSS分析"选项以访问分析功能。


3. 点击"立即分析"按钮,从可用分析方法中选择"回归分析" 。


Accessing regression analysis feature from SPSS Analysis menu by clicking Analysis now button


执行回归分析


1. 选择要分析的因变量(Y)。


2. 选择要分析其对Y影响的自变量(X)。


3. 如果您想保存残差项用于模型验证,可以勾选相应的复选框。


Setting up regression analysis with dependent Y variable and independent X variables selection


4. 点击"确认" 按钮以生成回归分析结果。


Regression analysis results table displaying coefficients, p-values, VIF values, R-squared, and F-test statistics


解释回归结果


回归分析结果分四步解释:


步骤1:分析模型情况


- 模型拟合(R²):R²表示Y的变异有多少可以由所有X变量解释。例如,R² = 0.3表示所有X变量可以解释Y的30%的变异。


- 多重共线性(VIF):VIF值小于5(严格小于5)表示没有多重共线性问题。如果VIF大于10,表示模型构建不佳。


- F检验:用于确定至少一个X是否对Y有影响。如果F值标记有星号(*),表示显著(p < 0.05)。如果没有星号,表示p > 0.05。


步骤2:分析X的显著性


- 检查每个X变量的p值


- 如果p < 0.05(标记为*),表示存在显著影响关系


- 如果p < 0.01(标记为**),表示存在高度显著影响关系


- 如果p > 0.05(无星号),表示不存在显著影响关系


步骤3:确定X对Y的影响方向


- 回归系数B值大于0:正向影响(随着X增加,Y也增加)


- 回归系数B值小于0:负向影响(随着X增加,Y减少)


步骤4:比较影响的大小


- 比较标准化系数(Beta值)以确定不同X变量对Y的相对影响


- 当Beta > 0时,值越大,正向影响越大


- 当Beta < 0时,值越小,负向影响越大


模型验证


回归分析后,您可以验证回归模型。验证包括以下四个方面:


1. 多重共线性:


- 检查VIF值。如果所有VIF值都小于10(严格小于5),表示没有多重共线性问题,模型构建良好


- 如果VIF大于10,表示模型构建不佳


- 如果存在多重共线性,您可以使用逐步回归分析、岭回归分析,或执行相关分析以手动删除高度相关的项目


2. 自相关:


- 如果D-W值约为2(在1.7和2.3之间),表示没有自相关,模型构建良好


- 如果D-W值显著偏离2,表示存在自相关,模型构建不佳


- 当出现自相关问题时,建议检查因变量Y数据


3. 残差正态性:


- 在分析过程中保存残差项,然后使用"直方图"直观检查残差正态性


- 如果残差在视觉上满足正态性,表示模型构建良好


- 如果残差正态性非常差,建议重建模型,例如对Y取对数并重建模型


4. 异方差性:


- 使用保存的残差项与自变量X或因变量Y创建散点图


- 检查散点是否显示明显的模式,例如残差项随着X值增加而增加或减少


- 如果存在明显模式,表示存在异方差性,模型构建不佳


- 如果存在明显的异方差性,建议重建模型,例如对Y取对数并重建模型


重要说明


- 回归分析研究X(自变量)如何影响Y(因变量),其中X通常是定量数据,Y是定量数据


- 通常,应在回归分析之前进行相关分析,以首先了解是否存在关系


- 存在相关关系不一定意味着会有回归影响关系


- 模型验证包括检查多重共线性(VIF)、自相关(D-W)、残差正态性和异方差性


- VIF值小于5表示没有多重共线性问题;D-W值约为2(1.7-2.3)表示没有自相关


- 如果回归分析显示各种异常,使用描述性分析、箱线图、散点图等检查数据中的异常值


常见问题(FAQ)


问题1:我需要在回归分析之前执行相关分析吗?


答:通常,应在回归分析之前进行相关分析,以首先了解是否存在关系。回归分析研究是否存在影响关系。存在相关关系不一定意味着会有回归影响关系。您也可以在回归分析之前使用散点图直观检查数据关系。


问题2:如何比较不同自变量之间的影响大小?


答:如果自变量X已经显示对因变量Y有显著影响(p < 0.05),并且您想比较影响大小,可以使用标准化系数(Beta值)。当Beta > 0时,表示正向影响,值越大,影响越大。当Beta < 0时,表示负向影响,值越小,影响越大。


问题3:如果回归分析缺少Y(因变量)怎么办?


答:回归分析研究X对Y的影响。有时由于问卷设计问题,Y缺失(没有设计相应的问卷项目)。建议计算所有X项目的平均值来表示Y(使用"生成变量"平均值功能)。 


问题4:为什么单个X显示影响但多个X一起显示没有影响?


答:有时当只包含一个X时,它显示对Y有显著影响;但当包含多个X变量时,它们显示没有显著影响。这是非常正常的。当包含多个X变量时,可能存在"竞争"关系,并且可能出现多重共线性问题。研究人员应结合实际情况。通常,一次包含多个X变量更常见,相当于包含多个X变量的模型;而一次包含一个X重复进行相当于多个模型。


问题5:F值后面的括号中的两个值代表什么?


答:要从F值计算p值,需要两个自由度值(df1和df2)。通常,df1等于自变量的数量;df2等于样本量 - (自变量数量 1)。这两个值只是标准格式所需的中间过程值,没有其他实际意义。


问题6:简单回归和多元回归有什么区别?


答:当X变量的数量为1时,通常称为简单回归或单变量回归。当X变量的数量超过1时,称为多元回归。这种命名在线性回归和逻辑回归中都是一致的。


这篇文章有多大帮助?