SPSS 回帰分析

回帰分析(線形回帰分析)は、変数間の影響関係を調べる手法です。相関分析が分析項目間に関係があるかどうかを示すのに対して、回帰分析は X(独立変数、通常は定量データ)が Y(従属変数、定量データ)にどのように影響するかを分析します。相関関係があるからといって、必ずしも回帰による影響関係があるとは限りません。

回帰分析とは

回帰分析は本質的に、X(独立変数、通常は定量データ)が Y(従属変数、定量データ)にどのように影響するかを調べるものです。分析の流れは次の4つのステップで構成されます:


ステップ1:モデルの状況を分析する


- モデル適合度:R² はすべての X 変数によって Y のどれだけの変動が説明されるかを示します。例えば R² = 0.3 は、すべての X 変数で Y の変動の30%が説明できることを意味します。


- 多重共線性:VIF の値が 5 未満であれば多重共線性の問題はないと判断します。


- F 検定:少なくとも1つの X が Y に影響を与えているかどうかを判断するために用います。有意(アスタリスクで表示)であれば、少なくとも1つの X が Y に影響関係を持つことを示します。


ステップ2:X の有意性を分析する


- 有意であれば(p 値で判断)影響関係があることを示し、そうでなければ影響関係はないと判断します。


ステップ3:X が Y に与える影響の方向を判断する


- 回帰係数 B の値が 0 より大きければ正の影響、そうでなければ負の影響を示します。


ステップ4:その他の分析


- 影響の大きさを比較する(回帰係数 B の値を比較して、異なる X 変数が Y に与える相対的な影響を確認します)。


重要な注意点:一般的に、回帰分析の前に相関分析を行い、まず関係が存在するかを把握するべきです。回帰分析は影響関係があるかどうかを検証するものであり、相関関係があるからといって必ずしも回帰による影響関係があるとは限りません。

機能へのアクセス


1. SurveyMars のアンケートで、「分析結果」 セクションに移動します。


2. 「SPSS 分析」 オプションをクリックして分析機能にアクセスします。


3. 「今すぐ分析」 ボタンをクリックし、利用可能な分析方法から 「回帰分析」 を選択します。


SPSS 分析メニューから「今すぐ分析」ボタンをクリックして回帰分析機能にアクセスする方法


回帰分析の実行方法


1. 分析したい従属変数(Y)を選択します。


2. Y に対する影響を調べたい独立変数(X)を選択します。


3. モデル検証のために残差項を保存したい場合は、該当するチェックボックスをオンにします。


従属変数Yと独立変数Xを選択して回帰分析を設定する画面


4. 「確認」 ボタンをクリックして回帰分析結果を生成します。


係数、p 値、VIF 値、決定係数 (R-squared)、F 検定統計量を表示する回帰分析結果の表


回帰結果の解釈


回帰分析の結果は、次の4つのステップで解釈します:


ステップ1:モデルの状況を分析する


- モデル適合(R²):R² はすべての X 変数によって Y のどれだけの変動が説明されるかを示します。例えば R² = 0.3 は、すべての X 変数で Y の変動の30%が説明できることを意味します。


- 多重共線性(VIF):VIF が 5 未満(厳密には5より小さい)であれば多重共線性の問題はないと判断します。もし VIF が 10 を超える場合は、モデル構築が不適切であることを示します。


- F 検定:少なくとも1つの X が Y に影響を与えているかを判断するために用います。F 値がアスタリスク(*)で表示されていれば有意(p < 0.05)を示します。アスタリスクがない場合は p > 0.05 です。


ステップ2:X の有意性を分析する


- 各 X 変数の p 値を確認します


- p < 0.05(* 表示)の場合、有意な影響関係があることを示します


- p < 0.01(** 表示)の場合、非常に有意な影響関係があることを示します


- p > 0.05(アスタリスクなし)の場合、有意な影響関係はないことを示します


ステップ3:X が Y に与える影響の方向を判断する


- 回帰係数 B が 0 より大きい場合:正の影響(X が増えると Y も増える)


- 回帰係数 B が 0 より小さい場合:負の影響(X が増えると Y は減る)


ステップ4:影響の大きさを比較する


- 標準化係数(Beta 値)を比較して、異なる X 変数が Y に与える相対的な影響を判断します


- Beta > 0 の場合、値が大きいほど正の影響が大きくなります


- Beta < 0 の場合、値が小さいほど(より負の値であるほど)負の影響が大きくなります


モデルの検証


回帰分析後に回帰モデルの検証を行うことができます。検証には次の4 点が含まれます:


1. 多重共線性:


- VIF 値を確認します。すべての VIF 値が 10 未満(厳密には5より小さい)であれば、多重共線性の問題はなくモデルは良好に構築されていると判断できます。


- VIF が 10 を超える場合、モデル構築が不適切であることを示します


- 多重共線性が存在する場合は、逐次選択(ステップワイズ)回帰やリッジ回帰を使用するか、相関分析で高い相関のある項目を手動で除外することを検討します


2. 自己相関:


- D-W 値が概ね 2(1.7〜2.3 の間)であれば自己相関はなく、モデルは良好に構築されていることを示します


- D-W 値が 2 から大きく逸脱している場合、自己相関が存在しモデルが適切でないことを示します


- 自己相関の問題が発生した場合は、従属変数 Y のデータを確認することを推奨します


3. 残差の正規性:


- 分析時に残差項を保存し、その後「ヒストグラム」で残差の正規性を目視確認します


- 残差が目視で正規性を満たしている場合、モデルは良好に構築されていることを示します


- 残差の正規性が非常に悪い場合は、Y の対数を取るなどしてモデルを再構築することを検討してください


4. 分散不均一性(ヘテロスケダスティシティ):


- 保存した残差項と独立変数 X や従属変数 Y を使って散布図を作成します


- 散布点に明らかなパターン(例えば X の値が増えるにつれて残差が増減するなど)があるかを確認します


- 明らかなパターンがある場合、分散不均一性が存在しモデル構築が不十分であることを示します


- 明らかな分散不均一性がある場合は、Y の対数を取るなどしてモデルを再構築することを推奨します


重要な注意事項


- 回帰分析は X(独立変数)が Y(従属変数)にどのように影響するかを研究するもので、X・Y ともに通常は定量データです


- 一般に、回帰分析の前に相関分析を実施して、まず関係があるかを把握するべきです


- 相関関係があるからといって、必ずしも回帰による影響関係があるとは限りません


- モデル検証には、多重共線性(VIF)、自己相関(D-W)、残差の正規性、分散不均一性の確認が含まれます


- VIF が 5 未満であれば多重共線性の問題はないと判断できます。D-W が概ね 2(1.7-2.3)であれば自己相関はないと判断できます


- 回帰分析で異常が出た場合は、記述統計、箱ひげ図、散布図などでデータの外れ値を確認してください


よくある質問(FAQ)


Q1: 回帰分析の前に相関分析を行う必要がありますか?


A: 一般に、回帰分析の前に相関分析を行い、まず関係が存在するかを把握することを推奨します。回帰分析は影響関係があるかどうかを検証するものです。相関関係があるからといって必ずしも回帰による影響関係があるとは限りません。回帰分析の前に散布図を用いてデータの関係を目視確認することもできます。


Q2: 異なる独立変数間で影響の大きさをどう比較しますか?


A: 独立変数 X がすでに従属変数 Y に対して有意な影響を示している(p < 0.05)場合、影響の大きさを比較したいときは標準化係数(Beta 値)を使用します。Beta > 0 は正の影響を示し、値が大きいほど影響が大きくなります。Beta < 0 は負の影響を示し、値が小さいほど(より負の値であるほど)影響が大きくなります。


Q3: 回帰分析で Y(従属変数)が欠けている場合はどうすれば良いですか?


A: 回帰分析は X が Y に与える影響を調べるためのものです。アンケート設計の都合で Y が存在しない(対応する設問が設定されていない)場合があります。その場合は、すべての X 項目の平均を計算して Y を表す変数とすることを推奨します(「Generate Variable」の平均機能を使用するなど)。 


Q4: 単一の X では影響があるのに、複数の X を同時に入れると影響がないのはなぜですか?


A: 単独の X を含めた場合には Y に有意な影響を示すことがあっても、複数の X を同時に含めると有意でなくなることはよくあります。これは複数の X を同時に含めることで「競合」関係が生じたり、多重共線性が発生したりするためです。研究者は実際の状況を踏まえて判断する必要があります。一般的に、複数の X を一度に入れたモデルの方が実務的には多く用いられ、1つずつ入れて繰り返す解析は複数の別個のモデルに相当します。


Q5: F 値の後の括弧内の2つの値は何を表していますか?


A: F 値から p 値を求めるには、2つの自由度(df1 と df2)が必要です。一般的に df1 は独立変数の数、df2 はサンプル数 -(独立変数の数 + 1)になります。これらの2つの値は標準的な表記に必要な中間的な値であり、それ以上の特別な意味はありません。


Q6: 単回帰と重回帰の違いは何ですか?


A: X 変数が1つの場合は通常、単回帰(単変量回帰)と呼ばれます。X 変数が1より多い場合は重回帰と呼ばれます。この呼び方は線形回帰とロジスティック回帰のいずれでも一致します。


この記事はどのくらい役に立ちましたか?