2-9-2 節 多重共線性への対処方法・適用例

Eric's color bar icon

 この節では、SAS による多重共線性への適用例を幾つか示す。

2-9-2-1 重回帰分析の適用例(説明変数が少ない場合)
2-9-2-2 ロジスティック回帰分析の適用例1(説明変数が少ない場合)
2-9-2-3 ロジスティック回帰分析の適用例2(説明変数が多い場合)

 この節には、つぎの SAS プログラムのダウンロードコーナーがあります:

1.重回帰分析の SAS プログラム例(説明変数が少ない場合)
2.ロジスティック回帰分析の SAS プログラム例1
2.ロジスティック回帰分析の SAS プログラム例2

Eric's color bar icon

このページは、平成28年10月1日に開設しました。
このページは、令和2年5月7日に一部更新しました。

under construction icon

2-9-2-1 節 重回帰分析の適用例(説明変数が少数の場合)

 ここでは、2.1 節の重回帰分析の例とモデルのところで示した13名の学生の卒論の成績 を基準変数とし1年次から3年次までの成績を説明変数とする重回帰分析の場合における 説明変数間の多重共線性についての適用例を示す。つぎの SAS プログラムは、当該データの 多重共線性の有無の検討のためのものである。

1) 重回帰分析の SAS プログラム例1

*---------------------------------------------------------------------*
|                                                    October 17, 2016 |
|  sas program--mreg_multico-ex1.sas--                                |
|     example 2 of sasprograms for making a sas permanent file.       |
|                                                                     |
|  file name: c:\sasprog\MREG\mreg_multico-ex1.sas                    |
|                                                                     |
*---------------------------------------------------------------------*;
libname sasfile 'c:\permfile';
options pagesize=30;

  title 'histogram for the graduation thesis data';
proc chart data=sasfile.grad;
  vbar gradth achiev1-achiev3;
run;

  title 'scatter diagram for the graduation thesis data';
proc plot data=sasfile.grad;
  plot gradth*(achiev1--achiev3)/ haxis=50 to 90 by 5
                                  vaxis=50 to 90 by 5;
run;

options pagesize=60;
  title 'means and standard deviation of the data';
proc means data=sasfile.grad;
  var gradth achiev1-achiev3;
run;

  title 'correlations between the four variables';
proc corr data=sasfile.grad;
  var gradth achiev1-achiev3;
run;

  title 'Mreg for the graduation thesis data with collin parameter';
proc reg data=sasfile.grad simple corr;
  model gradth=achiev1-achiev3/tol vif collin;
run;

  title 'Mreg for the graduation thesis data with collinoint parameter';
proc reg data=sasfile.grad simple corr;
  model gradth=achiev1-achiev3/tol vif collinoint;
run;

quit;

 

--- 卒論データの多重共線性等の解析のためのSASプログラム ---

プログラムのダウンロード・コーナー

 うえのプログラムでは、最初に chart プロシジャで卒論から3年次の成績までの 棒グラフ、plot プロシジャで2変数間の散布図を、means プロシジャで各変数の 平均や標準偏差を、corr プロシジャで変数間相関行列と個々の相関係数の検定を 行った後、2種類の重回帰分析で多重共線性の有無を検討する。前者は collin オプションを指定することにより、モデルの定数項を考慮した場合、及び collinoint オプションでモデルの定数項を除いた場合である。これらのうち、最後の reg プロシジャ で、重回帰分析を行い、同時に多重共線性を検討した結果のみを以下に示す:

2) 重回帰分析の出力結果の一部

                          Mreg for the graduation thesis data with collin parameter                          10
                                                                              2016年10月17日 月曜日 16時19分49秒

                                                 REG プロシジャ

                                    読み込んだオブザベーション数          13
                                    使用されたオブザベーション数          13


                                                   記述統計量

変数               総和          平均   無修正平方和          分散      標準偏差   ラベル

Intercept      13.00000       1.00000       13.00000             0             0   Intercept
achiev1       860.00000      66.15385          57442      45.80769       6.76814   average mark in grade 1
achiev2       877.00000      67.46154          59857      57.76923       7.60061   average mark in grade 2
achiev3       989.00000      76.07692          75909      55.74359       7.46616   average mark in grade 3
gradth       1012.00000      77.84615          79332      45.97436       6.78044   mark on the graduation thesis


                                                     相関

 変数        ラベル                                 achiev1          achiev2          achiev3           gradth

 achiev1     average mark in grade 1                 1.0000           0.6999           0.6347           0.6670
 achiev2     average mark in grade 2                 0.6999           1.0000           0.8114           0.7987
 achiev3     average mark in grade 3                 0.6347           0.8114           1.0000           0.9418
 gradth      mark on the graduation thesis           0.6670           0.7987           0.9418           1.0000


                                                 REG プロシジャ
                                                モデル : MODEL1
                                従属変数 : gradth mark on the graduation thesis

                                    読み込んだオブザベーション数          13
                                    使用されたオブザベーション数          13


                                                    分散分析

                 要因                 自由度         平方和       平均平方       F 値    Pr > F

                 Model                     3      494.14258      164.71419      25.76    <.0001
                 Error                     9       57.54972        6.39441
                 Corrected Total          12      551.69231


                           Root MSE              2.52872    R2 乗              0.8957
                           従属変数の平均       77.84615    調整済み R2 乗     0.8609
                           変動係数              3.24835


                                                パラメータ推定値

                                                      パラメータ
   変数       ラベル                         自由度       推定値     標準誤差     t 値  Pr > |t|   トレランス

   Intercept  Intercept                           1     10.30377      8.11810     1.27    0.2362            .
   achiev1    average mark in grade 1             1      0.10196      0.15298     0.67    0.5218      0.49705
   achiev2    average mark in grade 2             1      0.04085      0.18011     0.23    0.8256      0.28433
   achiev3    average mark in grade 3             1      0.76293      0.16946     4.50    0.0015      0.33290

                                               パラメータ推定値

                         変数       ラベル                         自由度     分散拡大

                         Intercept  Intercept                           1            0
                         achiev1    average mark in grade 1             1      2.01187
                         achiev2    average mark in grade 2             1      3.51701
                         achiev3    average mark in grade 3             1      3.00390


                                                  共線性の診断

                                                 ---------------------ばらつきの割合---------------------
             数         固有値       条件指標      Intercept        achiev1        achiev2        achiev3

              1        3.98821        1.00000     0.00046710     0.00029823     0.00020650     0.00018408
              2        0.00636       25.04666        0.81839        0.01205        0.12395        0.02192
              3        0.00364       33.10067        0.03928        0.93093        0.05836        0.16434
              4        0.00180       47.11119        0.14186        0.05672        0.81748        0.81356


                         Mreg for the graduation thesis data with collinoint parameter                        12
                                                                              2016年10月17日 月曜日 16時19分49秒

                                                 REG プロシジャ

                                    読み込んだオブザベーション数          13
                                    使用されたオブザベーション数          13


                                                   記述統計量

変数               総和          平均   無修正平方和          分散      標準偏差   ラベル

Intercept      13.00000       1.00000       13.00000             0             0   Intercept
achiev1       860.00000      66.15385          57442      45.80769       6.76814   average mark in grade 1
achiev2       877.00000      67.46154          59857      57.76923       7.60061   average mark in grade 2
achiev3       989.00000      76.07692          75909      55.74359       7.46616   average mark in grade 3
gradth       1012.00000      77.84615          79332      45.97436       6.78044   mark on the graduation thesis


                                                     相関

 変数        ラベル                                 achiev1          achiev2          achiev3           gradth

 achiev1     average mark in grade 1                 1.0000           0.6999           0.6347           0.6670
 achiev2     average mark in grade 2                 0.6999           1.0000           0.8114           0.7987
 achiev3     average mark in grade 3                 0.6347           0.8114           1.0000           0.9418
 gradth      mark on the graduation thesis           0.6670           0.7987           0.9418           1.0000
                         

                                                 REG プロシジャ
                                                モデル : MODEL1
                                従属変数 : gradth mark on the graduation thesis

                                    読み込んだオブザベーション数          13
                                    使用されたオブザベーション数          13


                                                    分散分析

                 要因                 自由度         平方和       平均平方       F 値    Pr > F

                 Model                     3      494.14258      164.71419      25.76    <.0001
                 Error                     9       57.54972        6.39441
                 Corrected Total          12      551.69231


                           Root MSE              2.52872    R2 乗              0.8957
                           従属変数の平均       77.84615    調整済み R2 乗     0.8609
                           変動係数              3.24835


                                                パラメータ推定値

                                                      パラメータ
   変数       ラベル                         自由度       推定値     標準誤差     t 値  Pr > |t|   トレランス

   Intercept  Intercept                           1     10.30377      8.11810     1.27    0.2362            .
   achiev1    average mark in grade 1             1      0.10196      0.15298     0.67    0.5218      0.49705
   achiev2    average mark in grade 2             1      0.04085      0.18011     0.23    0.8256      0.28433
   achiev3    average mark in grade 3             1      0.76293      0.16946     4.50    0.0015      0.33290

                                               パラメータ推定値

                         変数       ラベル                         自由度     分散拡大

                         Intercept  Intercept                           1            0
                         achiev1    average mark in grade 1             1      2.01187
                         achiev2    average mark in grade 2             1      3.51701
                         achiev3    average mark in grade 3             1      3.00390


                                          共線性診断 (切片の調整済み)

                                                        --------------ばらつきの割合-------------
                    数         固有値       条件指標        achiev1        achiev2        achiev3

                     1        2.43320        1.00000        0.06183        0.04185        0.04641
                     2        0.38600        2.51069        0.86247        0.04523        0.23183
                     3        0.18079        3.66857        0.07570        0.91292        0.72176

 

--- 卒論データの多重共線性等の解析の出力結果 ---

 上の出力結果を見ると、2種類の重回帰分析のうちの最初の結果は、collin オプションを指定した 結果で、4つの条件指標のうち最大なものが 47.11 となっており、重回帰分析モデルに定数項を仮定 した場合には、かなりの多重共線性が示唆されるが、2つめの collinoint オプションを指定する、す なわちモデルの定数項を除くと、最大条件指標は、3.67 ほどになり、多重共線性の可能性はほとんど ないことがわかる。このデータの場合、定数項を外したモデルの方が妥当なモデルと考えれば、多重共 線性は見られないことになる。

Eric's abar10 icon

2-9-2-2 節 ロジスティック回帰分析の適用例1(説明変数が少ない場合)

 この節では、高井・千野 (2016) の虚記憶に関する研究におけるロジスティック回帰分析の適用例 を紹介する。この論文は高井の卒業論文(高井、2015) を追加・修正したもので、再認のみを行う 場合虚再認と特性不安の間に関連があるか、特性不安と状態不安の程度と非呈示語の侵入に関連が あるかを検討することを目的とする。そのための分析の1つとして、高井 (2015) は状態不安・特性 不安の再認成績への影響の有無を検討するため、正再認率、ソースエラー率、虚再認率、および 各項目に対する remember 率 (順に、CR, SR, FRと略記) と、非呈示語数の7変数のそれぞれを中央 値に基づき2分割し、ロジスティック回帰分析を行った。高井・千野 (2016)では、さらに当該デー タに対するロジスティック回帰分析における説明変数間の多重共線性の有無の検討及び AIC(Akaike's Information Criterion)を用いた複数の同解析モデルの適合度の検討を行っている。

 以下のプログラムは、上記データに対する SAS による多重共線性の検討も含めたロジスティック 回帰分析のためのプログラムの一部を示す。ここで、データはあらかじめ別のプログラムで永久 SAS ファイル (permanent SAS file)、takai.sas7bdat としてパソコンの c ドライブの下の permfile なるフォルダに保存されているとする。また、下記のプログラム中の変数名 corres, sorerr, 及び falrat は、それぞれ上記高井の正再認率、ソースエラー率、虚再認率、および各項目に対する remember 率の SAS 変数名に対応する。さらに、これらのそれぞれを基準変数とする重回帰分析や ロジスティック回帰分析における説明変数は、学習モダリティ(学習時に単語呈示を視覚的に行う か聴覚的に行うか)、再認モダリティ(再認検査時に単語呈示を視覚的に行うか聴覚的に行うか)、 両者の交互作用、状態不安と特性不安及び両者の交互作用あり、順に SAS 変数名は lav, tav, lavtav, stanx, tranx, stantran とした。また、正再認率、ソースエラー率、虚再認率、および 各項目に対する remember 率 の3変数を基準変数とする分析のうち、ここでは第1変数である正再 認率 corres に関する部分のみを示した。

1) ロジスティック回帰分析の SAS プログラム例1

*----------------------------------------------------------------------*
|                                                   September 24, 2016 |
|  sas program--logistic-analysis1-revised-for-Takai.sas--             |
|       a sasprogram for a fundamental analysis of Takai's thesis data.|
|                                                                      |
*----------------------------------------------------------------------*;
libname sasfile 'c:\permfile';
options pagesize=60;

data work;
  set sasfile.takai;
  corres=(nocor/18-tnsm/12);
  sorerr=(tserr/18-tdifm/12);
  falrat=(tfrec/6-tnfr/4);

  remc=norem/nocor;
  if tfrec ne 0 then remf=nofrem/tfrec;
  else remf=0;

  if tserr ne 0 then rems=nosrem/tserr; 
  else rems=0;

  if tnsm ne 0 then remnonc=nsmrem/tnsm;
  else remnonc=0;

  if tdifm ne 0 then remnons=difmrem/tdifm;
  else remnons=0;

  if tnfr ne 0 then remnonf=nfrrem/tnfr;
  else remnonf=0;

  crate=remc-remnonc; srate=rems-remnons; frate=remf-remnonf;
  nopre=tnsm+tdifm+tnfr;

  output;
run;

/* Analysis for */
             /* the crest variable */

data temp1;
  set work;
  if corres ge 0.63 then crest=1;
  else crest=2;
  lavtav=lav*tav;
  stantran=stanx*tranx;
  output;
run;

/* Analyses of multicollinearity for variables including the interaction. */

  title 'reg. of crest data with collin pars., others, and an interaction';
proc reg data=temp1;
  model crest=lav tav lavtav stanx tranx stantran/tol vif collin;
run;

  title 'reg. of crest data with collinoint pars., others, and an interaction';
proc reg data=temp1;
  model crest=lav tav lavtav stanx tranx stantran/tol vif collinoint;
run;

/* Analyses of multicollinearity for variables excluding the interaction. */

  title 'reg. of crest data with collin parameter and others';
proc reg data=temp1;
  model crest=lav tav lavtav stanx tranx/tol vif collin;
run;

  title 'reg. of crest data with collinoint parameter and others';
proc reg data=temp1;
  model crest=lav tav lavtav stanx tranx/tol vif collinoint;
run;

/* Logistic regression for variables including the interaction. */

  title 'logistic reg. (1) for vars. including the interaction/resp=crest';
proc logistic data=temp1;
  class lav tav;
  model crest=lav tav lav*tav stanx tranx stanx*tranx/clparm=pl tech=newton;
run;

/* Logistic regression for variables excluding the interaction. */

  title 'logistic reg. (2) for correst recognition data/resp=crest';
proc logistic data=temp1;
  class lav tav;
  model crest=lav tav lav*tav stanx tranx/clparm=pl tech=newton;
run;

quit;
 

--- 高井・千野 (2016) による高井データの多重共線性等の解析のためのSASプログラム ---

プログラムのダウンロード・コーナー

Eric's abar10 icon

logistic-analysis1-revised-for-Takai.sas

 上記プログラムでは、1つめのデータ文で変数名 corres, sorerr, 及び falrat などの変数 を、永久 SAS ファイル takai.sas7bdat で定義されている変数を用いて新たに定義している。 つぎに、2つ目のデータ文ではまず1つ目のデータ文で定義した corres 変数を、あらかじめ 別のプログラムで計算した中央値 0.63 を用いて中央値以上か未満かで1、2と定性変数化して いる。また、2つの定性的変数 lav, tav 及び2つの定量的変数 stanx, tranx の交互作用項を lavtav, 及び stantran なる変数として、後続の重回帰分析やロジスティック回帰分析に備えて 定義している。これらの準備の後、まず4本の重回帰分析プログラムを用いてロジスティック 回帰分析の前に、当初予定していた説明変数 lav, tav, lavtav, stanx, tranx,stantran 間の 多重共線性の有無の検討を行っている。

 ここで同上データに対して重回帰分析を行うに際して注意すべき点が1つある。それは、重 回帰分析では原則として基準変数も説明変数もすべて定量的変数でなければならない、という 点である。これに対して、上記データの説明変数のうち lav, tav は定性的変数である。この ような場合、一般的には重回帰分析を行う前に、どの定性的変数についても ダミー変数化しておく必要がある。ダミー変数 (dummy variable) の作成については、本ホームページのロジスティック回帰分析の概要についての 4.5.1 節 ロジスティック回帰分析の データとモデルに詳しく記述してあるので、参考にされたい。ただし、高井のデータでは、 2つの定性的変数 lav, tav は、共に2値データでありかつ (0,1) 型になっており、最初から ダミー変数と同一のコーディングがなされているので、あらためてダミー変数化する必要はない。

 最初の2本のプログラムではこれらすべての説明変数を対象として、SAS の重回帰分析におけ る多重共線性の検討のための1つのパラメータである collin オプ ション及び collinoint オプションを順に指定している。前者は、 重回帰方程式モデルのパラメータの1つであるモデルの定数項を含む場合、後者は同定数項を 含まない場合のオプションである。どちらを選択するべきかは、データの性質等に依存する。 ここでは、両方のオプションを順に指定し、出力結果を検討することとした。

 つぎの2本の重回帰分析では、特性不安と状態不安の2変数の交互作用項を除いて同様の分 析を行ったものである。いずれにせよ、これら4本の重回帰分析プログラムで注意すべきは、す べてのプログラムでの基準変数は crest すなわち、正再認率というもとの定量的変数を上記2 つ目のデータ文で定性化した定性的変数である点である。このような定性的変数を重回帰分析 の基準変数とすることは、通常は正しくない。しかし、SAS の重回帰分析では、このような場 合でも基準変数があたかも定量的変数であるかのように扱って、通常の分析を行い、通常の重 回帰分析の結果を出力し、さらに多重共線性の指標を出力する。われわれが多重共線性を、基準 変数が定性的変数の場合(すなわち、本来はロジスティック回帰分析等を行うべき場合)に重 回帰分析を用いるときは、出力される通常の重回帰分析結果は無視し、同時に出力される多重 共線性関連の出力のみ見ればよい。その理由は、本来多重共線性は説明変 数間の特別な関連性に関わるものであり、基準変数には何ら関係がないからである。

 最後に同上プログラムでは、基準変数を crest と指定してロジスティック回帰分析(logistic procedure)を2種類実行する。最初は、2つの定性的変数 lav, tav とそれらの交互作用、及び 2つの定量的変数 stanx, tranx 及びそれらの交互作用の合計6変数を説明変数とするロジス ティック回帰分析を、2つめは前者から stanx と tranx の交互作用を省いた5変数を説明変数 とする同解析である。ロジスティック回帰分析の SAS プログラムでは、説 明変数のうち定性的説明変数については、model 文の直前に class 文を用いてあらかじめ指定し ておく必要がある。また、ロジスティック回帰分析では重回帰分析 の SAS プログラムと異なり、説明変数間の交互作用については重回帰分析の場合のようにあら かじめ新たな変数として定義しておかず、同プログラムの model 文の右辺の説明変数のリス トを指定する中で、「*」印を用いて直接交互作用を定義することができる

2) ロジスティック回帰分析の出力結果例1

reg. of crest data with collin pars., others, and an interaction 1 2016年 9月27日 火曜日 09時52分44秒 REG プロシジャ モデル : MODEL1 従属変数 : crest 読み込んだオブザベーション数 30 使用されたオブザベーション数 30 分散分析 要因 自由度 平方和 平均平方 F 値 Pr > F Model 6 1.95873 0.32646 1.36 0.2741 Error 23 5.54127 0.24092 Corrected Total 29 7.50000 Root MSE 0.49084 R2 乗 0.2612 従属変数の平均 1.50000 調整済み R2 乗 0.0684 変動係数 32.72272 パラメータ推定値 パラメータ 変数 自由度 推定値 標準誤差 t 値 Pr > |t| トレランス 分散拡大 Intercept 1 0.55219 2.00537 0.28 0.7855 . 0 lav 1 0.32817 0.25575 1.28 0.2122 0.49113 2.03610 tav 1 0.57085 0.26506 2.15 0.0420 0.45723 2.18706 lavtav 1 -0.27817 0.36125 -0.77 0.4491 0.34400 2.90698 stanx 1 -0.01033 0.05275 -0.20 0.8465 0.03512 28.47271 tranx 1 0.02177 0.03470 0.63 0.5366 0.05638 17.73707 stantran 1 -0.00004805 0.00082491 -0.06 0.9541 0.01399 71.46315 共線性の診断 数 固有値 条件指標 1 5.34194 1.00000 2 0.94079 2.38288 3 0.53475 3.16065 4 0.11931 6.69145 5 0.05354 9.98892 6 0.00920 24.09994 7 0.00048301 105.16533 共線性の診断 -----------------------------------------ばらつきの割合---------------------------------------- 数 Intercept lav tav lavtav stanx tranx stantran 1 0.00006535 0.00533 0.00496 0.00387 0.00004600 0.00007644 0.00005558 2 0.00008036 0.02239 0.02100 0.16129 0.00009290 0.00016080 0.00016748 3 1.031262E-9 0.22895 0.21323 5.757248E-7 0.00000357 0.00000581 4.02263E-10 4 0.00032030 0.52287 0.48138 0.71499 0.00011944 0.00034533 0.00187 reg. of crest data with collin pars., others, and an interaction 2 2016年 9月27日 火曜日 09時52分44秒 REG プロシジャ モデル : MODEL1 従属変数 : crest 共線性の診断 -----------------------------------------ばらつきの割合---------------------------------------- 数 Intercept lav tav lavtav stanx tranx stantran 5 0.01961 0.20776 0.18954 0.11100 0.00001423 0.00025418 0.01193 6 0.00124 0.00674 0.08059 0.00714 0.06547 0.14265 0.00031385 7 0.97869 0.00595 0.00931 0.00171 0.93425 0.85651 0.98566 reg. of crest data with collinoint pars., others, and an interaction 3 2016年 9月27日 火曜日 09時52分44秒 REG プロシジャ モデル : MODEL1 従属変数 : crest 読み込んだオブザベーション数 30 使用されたオブザベーション数 30 分散分析 要因 自由度 平方和 平均平方 F 値 Pr > F Model 6 1.95873 0.32646 1.36 0.2741 Error 23 5.54127 0.24092 Corrected Total 29 7.50000 Root MSE 0.49084 R2 乗 0.2612 従属変数の平均 1.50000 調整済み R2 乗 0.0684 変動係数 32.72272 パラメータ推定値 パラメータ 変数 自由度 推定値 標準誤差 t 値 Pr > |t| トレランス 分散拡大 Intercept 1 0.55219 2.00537 0.28 0.7855 . 0 lav 1 0.32817 0.25575 1.28 0.2122 0.49113 2.03610 tav 1 0.57085 0.26506 2.15 0.0420 0.45723 2.18706 lavtav 1 -0.27817 0.36125 -0.77 0.4491 0.34400 2.90698 stanx 1 -0.01033 0.05275 -0.20 0.8465 0.03512 28.47271 tranx 1 0.02177 0.03470 0.63 0.5366 0.05638 17.73707 stantran 1 -0.00004805 0.00082491 -0.06 0.9541 0.01399 71.46315 共線性診断 (切片の調整済み) -------------------------------ばらつきの割合------------------------------- 数 固有値 条件指標 lav tav lavtav stanx tranx stantran 1 2.78690 1.00000 0.00209 0.00196 0.00360 0.00382 0.00605 0.00173 2 1.69006 1.28413 0.06506 0.06282 0.09985 0.00042549 0.00042813 0.00016588 3 1.10944 1.58492 0.21240 0.19459 0.00003376 0.00073546 0.00126 2.25348E-9 4 0.22705 3.50351 0.24851 0.00572 0.12718 0.05439 0.11024 0.00017270 5 0.17771 3.96014 0.46845 0.72207 0.76683 0.01332 0.02697 0.00010357 6 0.00886 17.73964 0.00349 0.01285 0.00250 0.92731 0.85505 0.99783 reg. of crest data with collin parameter and others 4

 上記の出力結果は、高井データで2つの定量的変数 stanx, tranx の交互作用項も含めた重回帰 分析で、前半がcollin パラメータを、後半が collinoint を指定した場合の結果である。共に、 結果を見ればわかるように、通常の重回帰分析の結果である重相関係数の検定や偏回帰係数の検定 に引き続いて、多重共線性の各種指標が示されている。最初の collin パラメータを指定した場合 の「共線性診断」の項の固有値と条件指標の値を見ると、最大条件指標の値は約 105.17 となって いる。この値は、Belsley et al. (1980) の基準からは説明変数間に強い共線性があることを示唆 している。一方、後半の collinoint パラメータを指定した場合には、同最大条件指標の値は約 17.74 となっており、説明変数間には弱い共線性しかないことがわかる。

 つぎに、前者から stanx と tranx の交互作用を省いた5変数を説明変数 とする重回帰分析で 上と同様 collin 及び collinoint パラメータを指定した同分析を行った結果を示したのが、つぎ の出力である。

                              reg. of crest data with collin parameter and others                              4
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                                 REG プロシジャ
                                                モデル : MODEL1
                                               従属変数 : crest

                                    読み込んだオブザベーション数          30
                                    使用されたオブザベーション数          30


                                                    分散分析

                 要因                 自由度         平方和       平均平方       F 値    Pr > F

                 Model                     5        1.95791        0.39158       1.70    0.1740
                 Error                    24        5.54209        0.23092
                 Corrected Total          29        7.50000


                           Root MSE              0.48054    R2 乗              0.2611
                           従属変数の平均        1.50000    調整済み R2 乗     0.1071
                           変動係数             32.03611


                                                パラメータ推定値

                             パラメータ
     変数         自由度         推定値       標準誤差       t 値    Pr > |t|     トレランス       分散拡大

     Intercept         1        0.66514        0.50095       1.33      0.1967              .              0
     lav               1        0.32730        0.24996       1.31      0.2028        0.49279        2.02925
     tav               1        0.57250        0.25801       2.22      0.0362        0.46252        2.16205
     lavtav            1       -0.27910        0.35333      -0.79      0.4373        0.34467        2.90131
     stanx             1       -0.01326        0.01534      -0.86      0.3960        0.39789        2.51329
     tranx             1        0.01990        0.01281       1.55      0.1334        0.39670        2.52078


                                                  共線性の診断

                                    -------------------------------ばらつきの割合-------------------------------
      数       固有値     条件指標    Intercept          lav          tav       lavtav        stanx        tranx

       1      4.48512      1.00000      0.00139      0.00801      0.00751      0.00635   0.00070618   0.00072851
       2      0.84347      2.30596      0.00310      0.01680      0.01587      0.17940      0.00211      0.00225
       3      0.53475      2.89610  6.332753E-9      0.22972      0.21569  3.640578E-7   0.00004011   0.00004128
       4      0.10579      6.51140      0.00193      0.68268      0.63356      0.79525      0.00548      0.00867
       5      0.02176     14.35772      0.99356      0.05370      0.05091      0.01240      0.10359      0.10833
       6      0.00912     22.17338   0.00001751      0.00909      0.07644      0.00661      0.88808      0.87998


                            reg. of crest data with collinoint parameter and others                            5
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                                 REG プロシジャ
                                                モデル : MODEL1
                                               従属変数 : crest

                                    読み込んだオブザベーション数          30
                                    使用されたオブザベーション数          30


                                                    分散分析

                 要因                 自由度         平方和       平均平方       F 値    Pr > F

                 Model                     5        1.95791        0.39158       1.70    0.1740
                 Error                    24        5.54209        0.23092
                 Corrected Total          29        7.50000


                           Root MSE              0.48054    R2 乗              0.2611
                           従属変数の平均        1.50000    調整済み R2 乗     0.1071
                           変動係数             32.03611


                                                パラメータ推定値

                             パラメータ
     変数         自由度         推定値       標準誤差       t 値    Pr > |t|     トレランス       分散拡大

     Intercept         1        0.66514        0.50095       1.33      0.1967              .              0
     lav               1        0.32730        0.24996       1.31      0.2028        0.49279        2.02925
     tav               1        0.57250        0.25801       2.22      0.0362        0.46252        2.16205
     lavtav            1       -0.27910        0.35333      -0.79      0.4373        0.34467        2.90131
     stanx             1       -0.01326        0.01534      -0.86      0.3960        0.39789        2.51329
     tranx             1        0.01990        0.01281       1.55      0.1334        0.39670        2.52078


                                           共線性診断 (切片の調整済み)

                                          ---------------------------ばらつきの割合--------------------------
         数        固有値      条件指標           lav           tav        lavtav         stanx         tranx

          1       1.94303       1.00000       0.03026       0.02887       0.04798       0.04842       0.05154
          2       1.54416       1.12175       0.03709       0.03690       0.05563       0.06876       0.06282
          3       1.10944       1.32339       0.21317       0.19678    0.00003472       0.00826       0.00892
          4       0.22604       2.93189       0.25933       0.00737       0.13436       0.68528       0.70203
          5       0.17733       3.31012       0.46015       0.73008       0.76199       0.18928       0.17469
 

 2つの不安の2尺度の交互作用を含めた場合の重回帰分析と同様に、collin 及び collinoint パラメータを指定した場合の出力結果の条件指標を見ると、それぞれ順に約 22.17 及び 3.31 と なっている。交互作用を含めない場合には、説明変数間に強い共線性は見られないことがわかる。 これらの結果からは、基準変数を crest とする場合には、不安2尺度の交互作用項をロジスティック 回帰分析では外した方がよさそうなことが示唆される。

 しかしながら、ここでは念のため説明変数として不安2尺度の交互作用項を含めた場合と含めない 場合の両方でロジスティック回帰分析を行ってみた。これらが、上記の SAS プログラムの最後の 2つの proc logistic による解析である。出力結果は以下の通りである。

                        logistic reg. (1) for vars. including the interaction/resp=crest                       6
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                              LOGISTIC プロシジャ

                                                 モデルの情報

                                        データセット     WORK.TEMP1
                                        応答変数         crest
                                        応答の水準数     2
                                        モデル           binary logit
                                        最適化の手法     Newton-Raphson


                                    読み込んだオブザベーション           30
                                    使用されたオブザベーション           30


                                                反応プロファイル

                                          順番        crest     度数の合計

                                             1            1             15
                                             2            2             15

                                       モデルの確率基準は crest=1 です。


                                              分類変数の水準の情報

                                          分類     値     デザイン変数

                                          lav      0                 1
                                                   1                -1

                                          tav      0                 1
                                                   1                -1


                                                 モデル収束状態

                        収束基準(GCONV=1E-8)は満たされました。


                                              モデルの適合度統計量

                                    基準           切片のみ     切片と共変量

                                    AIC              43.589           46.280
                                    SC               44.990           56.088
                                    -2 Log L         41.589           32.280


                        logistic reg. (1) for vars. including the interaction/resp=crest                       7
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                              LOGISTIC プロシジャ

                                         包括的帰無仮説: BETA=0 の検定

                           検定                 カイ 2 乗値     自由度     Pr > ChiSq

                           尤度比                    9.3092          6         0.1569
                           スコア                    7.8349          6         0.2504
                           Wald                      5.1317          6         0.5270


                                                  Joint 検定

                                                              Wald
                               効果           自由度     カイ 2 乗    Pr > ChiSq

                               lav                 1        1.5294        0.2162
                               tav                 1        4.4744        0.0344
                               lav*tav             1        0.9870        0.3205
                               stanx               1        0.1924        0.6609
                               tranx               1        0.4204        0.5168
                               stanx*tranx         1        0.0159        0.8996

NOTE: Under full-rank parameterizations, Type 3 effect tests are replaced by joint tests. The joint test for an
      effect is a test that all the parameters associated with that effect are zero. Such joint tests might not
      be equivalent to Type 3 effect tests under GLM parameterization.


                                               最尤推定値の分析

                                                                            Wald
                 パラメータ         自由度      推定値    標準誤差     カイ 2 乗    Pr > ChiSq

                 Intercept               1      1.6869      9.1655        0.0339        0.8540
                 lav         0           1      0.5890      0.4763        1.5294        0.2162
                 tav         0           1      1.2374      0.5850        4.4744        0.0344
                 lav*tav     0 0         1      0.5003      0.5036        0.9870        0.3205
                 stanx                   1      0.1121      0.2555        0.1924        0.6609
                 tranx                   1     -0.1017      0.1569        0.4204        0.5168
                 stanx*tranx             1    -0.00049     0.00385        0.0159        0.8996


                                     予測確率と観測データの応答との関連性

                                 一致の割合       76.0    Somers の D    0.520
                                 不一致の割合     24.0    ガンマ         0.520
                                 タイの割合        0.0    Tau-a          0.269
                                 組                225    c              0.760


                                 パラメータ推定とプロファイル尤度による信頼区間

                             パラメータ            推定値          95% 信頼限界

                             Intercept             1.6869     -16.1940      21.6313
                             lav         0         0.5890      -0.2935       1.6550
                             tav         0         1.2374       0.2465       2.6477

                        logistic reg. (1) for vars. including the interaction/resp=crest                       8
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                              LOGISTIC プロシジャ

                                 パラメータ推定とプロファイル尤度による信頼区間

                             パラメータ            推定値          95% 信頼限界

                             lav*tav     0 0       0.5003      -0.4208       1.6671
                             stanx                 0.1121      -0.4053       0.6329
                             tranx                -0.1017      -0.4404       0.2096
                             stanx*tranx         -0.00049     -0.00831      0.00746


                           logistic reg. (2) for correst recognition data/resp=crest                           9
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                              LOGISTIC プロシジャ

                                                 モデルの情報

                                        データセット     WORK.TEMP1
                                        応答変数         crest
                                        応答の水準数     2
                                        モデル           binary logit
                                        最適化の手法     Newton-Raphson


                                    読み込んだオブザベーション           30
                                    使用されたオブザベーション           30


                                                反応プロファイル

                                          順番        crest     度数の合計

                                             1            1             15
                                             2            2             15

                                       モデルの確率基準は crest=1 です。


                                              分類変数の水準の情報

                                          分類     値     デザイン変数

                                          lav      0                 1
                                                   1                -1

                                          tav      0                 1
                                                   1                -1


                                                 モデル収束状態

                        収束基準(GCONV=1E-8)は満たされました。


                                              モデルの適合度統計量

                                    基準           切片のみ     切片と共変量

                                    AIC              43.589           44.295
                                    SC               44.990           52.703
                                    -2 Log L         41.589           32.295


                           logistic reg. (2) for correst recognition data/resp=crest                          10
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                              LOGISTIC プロシジャ

                                         包括的帰無仮説: BETA=0 の検定

                           検定                 カイ 2 乗値     自由度     Pr > ChiSq

                           尤度比                    9.2934          5         0.0979
                           スコア                    7.8317          5         0.1658
                           Wald                      5.1811          5         0.3942


                                                  Joint 検定

                                                            Wald
                                 効果       自由度     カイ 2 乗    Pr > ChiSq

                                 lav             1        1.5391        0.2148
                                 tav             1        4.5780        0.0324
                                 lav*tav         1        0.9809        0.3220
                                 stanx           1        1.0922        0.2960
                                 tranx           1        2.7340        0.0982

NOTE: Under full-rank parameterizations, Type 3 effect tests are replaced by joint tests. The joint test for an
      effect is a test that all the parameters associated with that effect are zero. Such joint tests might not
      be equivalent to Type 3 effect tests under GLM parameterization.


                                                最尤推定値の分析

                                                                            Wald
                  パラメータ        自由度      推定値    標準誤差     カイ 2 乗    Pr > ChiSq

                  Intercept              1      2.8037      2.4740        1.2843        0.2571
                  lav        0           1      0.5892      0.4750        1.5391        0.2148
                  tav        0           1      1.2238      0.5720        4.5780        0.0324
                  lav*tav    0 0         1      0.4890      0.4937        0.9809        0.3220
                  stanx                  1      0.0814      0.0779        1.0922        0.2960
                  tranx                  1     -0.1193      0.0722        2.7340        0.0982


                                                オッズ比の推定

                                                              95% Wald
                                   効果       点推定          信頼限界

                                   stanx       1.085       0.931       1.264
                                   tranx       0.888       0.770       1.022


                                     予測確率と観測データの応答との関連性

                                 一致の割合       75.6    Somers の D    0.511
                                 不一致の割合     24.4    ガンマ         0.511
                                 タイの割合        0.0    Tau-a          0.264
                                 組                225    c              0.756
                           logistic reg. (2) for correst recognition data/resp=crest                          11
                                                                              2016年 9月24日 土曜日 15時33分44秒

                                              LOGISTIC プロシジャ

                                パラメータ推定とプロファイル尤度による信頼区間

                             パラメータ           推定値          95% 信頼限界

                             Intercept            2.8037      -1.7479       8.3922
                             lav        0         0.5892      -0.2913       1.6506
                             tav        0         1.2238       0.2496       2.6031
                             lav*tav    0 0       0.4890      -0.4167       1.6291
                             stanx                0.0814      -0.0706       0.2491
                             tranx               -0.1193      -0.2862       0.0113
 

 上記の不安2尺度の交互作用項を含めた場合と含めない場合の2種類のロジスティック回帰 分析における出力結果の中の「包括的帰無仮説: BETA=0 の検定」 の項を見ると、これらのモデルに対する尤度比検定の結果の p-値は、それぞれ順に 0.1569 及び 0.0979 となり、共に かろうじて有意な傾向があることがわかる。一方、「包括的帰無仮説: BETA=0 の検定」の項の1つ前の「モデルの適合度統計量」 の項の AIC (Akaike's Information Criterion) の値を見ると、 不安2尺度の交互作用項を含めた場合と含めない場合の2種類のロジスティック回帰分析に おけるモデルの適合度の指標の1つである AIC は、順に 46.280 及び 44.295 となっており、交互作用項を含めない方がより良 いモデルであることが示唆される。

 これまでの重回帰分析による多重共線性の検討結果とロジスティック回帰分析の結果に おける情報量基準 AIC による検討結果を総合すると、基準変数を crest とした場合の ロジスティック回帰分析には不安2尺度の交互作用項は含めない方がよいと考えた方が よさそうである。そこで、最後に上記一連の SAS プログラムの最後の出力結果である 不安2尺度の交互作用項を含めない場合のロジスティック回帰分析の結果のうちの 「Joint 検定」の項を見ると、p-値から説明変数 tav が 5パーセント水準で有意であることと、tranx が有意な傾向にあることがわかる。

 そこで、つぎにこれら2変数が crest すなわち 正再認率の高低(1、高群/2、低群)にどのように効いているのかを、tav すなわち再認 モダリティの高低(もとの入力値では、0、視覚呈示/1、聴覚呈示)および tranx すなわ ち特性不安の高低(定量変数)ごとに、後続の出力である「最尤推定値の分析」の項の対応 するモデルパラメータの推定値を見ることにより検討した。まず、再認モダリティの高低は、 もとの入力値は視覚呈示を0、聴覚呈示を1としたが、SAS の解析プログラムでは前者が1、 後者は-1と変換されていることが、出力結果の「分類変数の水準の情報」の項に表示され ていることに注意しよう。この点に注意しながら出力結果の中の「 最尤推定値の分析」の項の tav 変数に対する重み係数の推定値を見ると約 1.22 であることから、学習後の再認時に刺激を視覚呈示され たときは、聴覚呈示されたときよりも実験参加者の正再認率は高くなることがわかる。一 方、tranx すなわち特性不安得点の高低については、これに対する重み係数のすいて値は約 -0.12 である。その結果、特性不安が高い実験参加者は低い実験 参加者に比べて、正再認率は低くなる傾向があることがわかる。最後に出力結果の 「オッズ比の推定」結果を見ると、オッズ比は両説明変数共、 95 パーセント信頼区間が1を跨いでいることがわかる。この結果は、両説明変数の 効果があるとは言い切れないことを示唆しているが、もともと最初に指摘したように、 crest に対するロジスティック回帰分析のモデルの適合度が、有意ではなく有意な傾向を 示していたに過ぎないことを考慮するとやむを得ないであろう。

Eric's color bar icon