2-9-2-1 重回帰分析の適用例(説明変数が少ない場合) |
2-9-2-2 ロジスティック回帰分析の適用例1(説明変数が少ない場合) |
2-9-2-3 ロジスティック回帰分析の適用例2(説明変数が多い場合) |
この節には、つぎの SAS プログラムのダウンロードコーナーがあります:
1.重回帰分析の SAS プログラム例(説明変数が少ない場合) |
2.ロジスティック回帰分析の SAS プログラム例1 |
2.ロジスティック回帰分析の SAS プログラム例2 |
このページは、平成28年10月1日に開設しました。
このページは、令和2年5月7日に一部更新しました。
2-9-2-1 節 重回帰分析の適用例(説明変数が少数の場合)
ここでは、2.1 節の重回帰分析の例とモデルのところで示した13名の学生の卒論の成績 を基準変数とし1年次から3年次までの成績を説明変数とする重回帰分析の場合における 説明変数間の多重共線性についての適用例を示す。つぎの SAS プログラムは、当該データの 多重共線性の有無の検討のためのものである。
*---------------------------------------------------------------------* | October 17, 2016 | | sas program--mreg_multico-ex1.sas-- | | example 2 of sasprograms for making a sas permanent file. | | | | file name: c:\sasprog\MREG\mreg_multico-ex1.sas | | | *---------------------------------------------------------------------*; libname sasfile 'c:\permfile'; options pagesize=30; title 'histogram for the graduation thesis data'; proc chart data=sasfile.grad; vbar gradth achiev1-achiev3; run; title 'scatter diagram for the graduation thesis data'; proc plot data=sasfile.grad; plot gradth*(achiev1--achiev3)/ haxis=50 to 90 by 5 vaxis=50 to 90 by 5; run; options pagesize=60; title 'means and standard deviation of the data'; proc means data=sasfile.grad; var gradth achiev1-achiev3; run; title 'correlations between the four variables'; proc corr data=sasfile.grad; var gradth achiev1-achiev3; run; title 'Mreg for the graduation thesis data with collin parameter'; proc reg data=sasfile.grad simple corr; model gradth=achiev1-achiev3/tol vif collin; run; title 'Mreg for the graduation thesis data with collinoint parameter'; proc reg data=sasfile.grad simple corr; model gradth=achiev1-achiev3/tol vif collinoint; run; quit; |
うえのプログラムでは、最初に chart プロシジャで卒論から3年次の成績までの 棒グラフ、plot プロシジャで2変数間の散布図を、means プロシジャで各変数の 平均や標準偏差を、corr プロシジャで変数間相関行列と個々の相関係数の検定を 行った後、2種類の重回帰分析で多重共線性の有無を検討する。前者は collin オプションを指定することにより、モデルの定数項を考慮した場合、及び collinoint オプションでモデルの定数項を除いた場合である。これらのうち、最後の reg プロシジャ で、重回帰分析を行い、同時に多重共線性を検討した結果のみを以下に示す:
Mreg for the graduation thesis data with collin parameter 10 2016年10月17日 月曜日 16時19分49秒 REG プロシジャ 読み込んだオブザベーション数 13 使用されたオブザベーション数 13 記述統計量 変数 総和 平均 無修正平方和 分散 標準偏差 ラベル Intercept 13.00000 1.00000 13.00000 0 0 Intercept achiev1 860.00000 66.15385 57442 45.80769 6.76814 average mark in grade 1 achiev2 877.00000 67.46154 59857 57.76923 7.60061 average mark in grade 2 achiev3 989.00000 76.07692 75909 55.74359 7.46616 average mark in grade 3 gradth 1012.00000 77.84615 79332 45.97436 6.78044 mark on the graduation thesis 相関 変数 ラベル achiev1 achiev2 achiev3 gradth achiev1 average mark in grade 1 1.0000 0.6999 0.6347 0.6670 achiev2 average mark in grade 2 0.6999 1.0000 0.8114 0.7987 achiev3 average mark in grade 3 0.6347 0.8114 1.0000 0.9418 gradth mark on the graduation thesis 0.6670 0.7987 0.9418 1.0000 REG プロシジャ モデル : MODEL1 従属変数 : gradth mark on the graduation thesis 読み込んだオブザベーション数 13 使用されたオブザベーション数 13 分散分析 要因 自由度 平方和 平均平方 F 値 Pr > F Model 3 494.14258 164.71419 25.76 <.0001 Error 9 57.54972 6.39441 Corrected Total 12 551.69231 Root MSE 2.52872 R2 乗 0.8957 従属変数の平均 77.84615 調整済み R2 乗 0.8609 変動係数 3.24835 パラメータ推定値 パラメータ 変数 ラベル 自由度 推定値 標準誤差 t 値 Pr > |t| トレランス Intercept Intercept 1 10.30377 8.11810 1.27 0.2362 . achiev1 average mark in grade 1 1 0.10196 0.15298 0.67 0.5218 0.49705 achiev2 average mark in grade 2 1 0.04085 0.18011 0.23 0.8256 0.28433 achiev3 average mark in grade 3 1 0.76293 0.16946 4.50 0.0015 0.33290 パラメータ推定値 変数 ラベル 自由度 分散拡大 Intercept Intercept 1 0 achiev1 average mark in grade 1 1 2.01187 achiev2 average mark in grade 2 1 3.51701 achiev3 average mark in grade 3 1 3.00390 共線性の診断 ---------------------ばらつきの割合--------------------- 数 固有値 条件指標 Intercept achiev1 achiev2 achiev3 1 3.98821 1.00000 0.00046710 0.00029823 0.00020650 0.00018408 2 0.00636 25.04666 0.81839 0.01205 0.12395 0.02192 3 0.00364 33.10067 0.03928 0.93093 0.05836 0.16434 4 0.00180 47.11119 0.14186 0.05672 0.81748 0.81356 Mreg for the graduation thesis data with collinoint parameter 12 2016年10月17日 月曜日 16時19分49秒 REG プロシジャ 読み込んだオブザベーション数 13 使用されたオブザベーション数 13 記述統計量 変数 総和 平均 無修正平方和 分散 標準偏差 ラベル Intercept 13.00000 1.00000 13.00000 0 0 Intercept achiev1 860.00000 66.15385 57442 45.80769 6.76814 average mark in grade 1 achiev2 877.00000 67.46154 59857 57.76923 7.60061 average mark in grade 2 achiev3 989.00000 76.07692 75909 55.74359 7.46616 average mark in grade 3 gradth 1012.00000 77.84615 79332 45.97436 6.78044 mark on the graduation thesis 相関 変数 ラベル achiev1 achiev2 achiev3 gradth achiev1 average mark in grade 1 1.0000 0.6999 0.6347 0.6670 achiev2 average mark in grade 2 0.6999 1.0000 0.8114 0.7987 achiev3 average mark in grade 3 0.6347 0.8114 1.0000 0.9418 gradth mark on the graduation thesis 0.6670 0.7987 0.9418 1.0000 REG プロシジャ モデル : MODEL1 従属変数 : gradth mark on the graduation thesis 読み込んだオブザベーション数 13 使用されたオブザベーション数 13 分散分析 要因 自由度 平方和 平均平方 F 値 Pr > F Model 3 494.14258 164.71419 25.76 <.0001 Error 9 57.54972 6.39441 Corrected Total 12 551.69231 Root MSE 2.52872 R2 乗 0.8957 従属変数の平均 77.84615 調整済み R2 乗 0.8609 変動係数 3.24835 パラメータ推定値 パラメータ 変数 ラベル 自由度 推定値 標準誤差 t 値 Pr > |t| トレランス Intercept Intercept 1 10.30377 8.11810 1.27 0.2362 . achiev1 average mark in grade 1 1 0.10196 0.15298 0.67 0.5218 0.49705 achiev2 average mark in grade 2 1 0.04085 0.18011 0.23 0.8256 0.28433 achiev3 average mark in grade 3 1 0.76293 0.16946 4.50 0.0015 0.33290 パラメータ推定値 変数 ラベル 自由度 分散拡大 Intercept Intercept 1 0 achiev1 average mark in grade 1 1 2.01187 achiev2 average mark in grade 2 1 3.51701 achiev3 average mark in grade 3 1 3.00390 共線性診断 (切片の調整済み) --------------ばらつきの割合------------- 数 固有値 条件指標 achiev1 achiev2 achiev3 1 2.43320 1.00000 0.06183 0.04185 0.04641 2 0.38600 2.51069 0.86247 0.04523 0.23183 3 0.18079 3.66857 0.07570 0.91292 0.72176 |
上の出力結果を見ると、2種類の重回帰分析のうちの最初の結果は、collin オプションを指定した 結果で、4つの条件指標のうち最大なものが 47.11 となっており、重回帰分析モデルに定数項を仮定 した場合には、かなりの多重共線性が示唆されるが、2つめの collinoint オプションを指定する、す なわちモデルの定数項を除くと、最大条件指標は、3.67 ほどになり、多重共線性の可能性はほとんど ないことがわかる。このデータの場合、定数項を外したモデルの方が妥当なモデルと考えれば、多重共 線性は見られないことになる。
2-9-2-2 節 ロジスティック回帰分析の適用例1(説明変数が少ない場合)
この節では、高井・千野 (2016) の虚記憶に関する研究におけるロジスティック回帰分析の適用例 を紹介する。この論文は高井の卒業論文(高井、2015) を追加・修正したもので、再認のみを行う 場合虚再認と特性不安の間に関連があるか、特性不安と状態不安の程度と非呈示語の侵入に関連が あるかを検討することを目的とする。そのための分析の1つとして、高井 (2015) は状態不安・特性 不安の再認成績への影響の有無を検討するため、正再認率、ソースエラー率、虚再認率、および 各項目に対する remember 率 (順に、CR, SR, FRと略記) と、非呈示語数の7変数のそれぞれを中央 値に基づき2分割し、ロジスティック回帰分析を行った。高井・千野 (2016)では、さらに当該デー タに対するロジスティック回帰分析における説明変数間の多重共線性の有無の検討及び AIC(Akaike's Information Criterion)を用いた複数の同解析モデルの適合度の検討を行っている。
以下のプログラムは、上記データに対する SAS による多重共線性の検討も含めたロジスティック 回帰分析のためのプログラムの一部を示す。ここで、データはあらかじめ別のプログラムで永久 SAS ファイル (permanent SAS file)、takai.sas7bdat としてパソコンの c ドライブの下の permfile なるフォルダに保存されているとする。また、下記のプログラム中の変数名 corres, sorerr, 及び falrat は、それぞれ上記高井の正再認率、ソースエラー率、虚再認率、および各項目に対する remember 率の SAS 変数名に対応する。さらに、これらのそれぞれを基準変数とする重回帰分析や ロジスティック回帰分析における説明変数は、学習モダリティ(学習時に単語呈示を視覚的に行う か聴覚的に行うか)、再認モダリティ(再認検査時に単語呈示を視覚的に行うか聴覚的に行うか)、 両者の交互作用、状態不安と特性不安及び両者の交互作用あり、順に SAS 変数名は lav, tav, lavtav, stanx, tranx, stantran とした。また、正再認率、ソースエラー率、虚再認率、および 各項目に対する remember 率 の3変数を基準変数とする分析のうち、ここでは第1変数である正再 認率 corres に関する部分のみを示した。
*----------------------------------------------------------------------* | September 24, 2016 | | sas program--logistic-analysis1-revised-for-Takai.sas-- | | a sasprogram for a fundamental analysis of Takai's thesis data.| | | *----------------------------------------------------------------------*; libname sasfile 'c:\permfile'; options pagesize=60; data work; set sasfile.takai; corres=(nocor/18-tnsm/12); sorerr=(tserr/18-tdifm/12); falrat=(tfrec/6-tnfr/4); remc=norem/nocor; if tfrec ne 0 then remf=nofrem/tfrec; else remf=0; if tserr ne 0 then rems=nosrem/tserr; else rems=0; if tnsm ne 0 then remnonc=nsmrem/tnsm; else remnonc=0; if tdifm ne 0 then remnons=difmrem/tdifm; else remnons=0; if tnfr ne 0 then remnonf=nfrrem/tnfr; else remnonf=0; crate=remc-remnonc; srate=rems-remnons; frate=remf-remnonf; nopre=tnsm+tdifm+tnfr; output; run; /* Analysis for */ /* the crest variable */ data temp1; set work; if corres ge 0.63 then crest=1; else crest=2; lavtav=lav*tav; stantran=stanx*tranx; output; run; /* Analyses of multicollinearity for variables including the interaction. */ title 'reg. of crest data with collin pars., others, and an interaction'; proc reg data=temp1; model crest=lav tav lavtav stanx tranx stantran/tol vif collin; run; title 'reg. of crest data with collinoint pars., others, and an interaction'; proc reg data=temp1; model crest=lav tav lavtav stanx tranx stantran/tol vif collinoint; run; /* Analyses of multicollinearity for variables excluding the interaction. */ title 'reg. of crest data with collin parameter and others'; proc reg data=temp1; model crest=lav tav lavtav stanx tranx/tol vif collin; run; title 'reg. of crest data with collinoint parameter and others'; proc reg data=temp1; model crest=lav tav lavtav stanx tranx/tol vif collinoint; run; /* Logistic regression for variables including the interaction. */ title 'logistic reg. (1) for vars. including the interaction/resp=crest'; proc logistic data=temp1; class lav tav; model crest=lav tav lav*tav stanx tranx stanx*tranx/clparm=pl tech=newton; run; /* Logistic regression for variables excluding the interaction. */ title 'logistic reg. (2) for correst recognition data/resp=crest'; proc logistic data=temp1; class lav tav; model crest=lav tav lav*tav stanx tranx/clparm=pl tech=newton; run; quit; |
logistic-analysis1-revised-for-Takai.sas |
上記プログラムでは、1つめのデータ文で変数名 corres, sorerr, 及び falrat などの変数 を、永久 SAS ファイル takai.sas7bdat で定義されている変数を用いて新たに定義している。 つぎに、2つ目のデータ文ではまず1つ目のデータ文で定義した corres 変数を、あらかじめ 別のプログラムで計算した中央値 0.63 を用いて中央値以上か未満かで1、2と定性変数化して いる。また、2つの定性的変数 lav, tav 及び2つの定量的変数 stanx, tranx の交互作用項を lavtav, 及び stantran なる変数として、後続の重回帰分析やロジスティック回帰分析に備えて 定義している。これらの準備の後、まず4本の重回帰分析プログラムを用いてロジスティック 回帰分析の前に、当初予定していた説明変数 lav, tav, lavtav, stanx, tranx,stantran 間の 多重共線性の有無の検討を行っている。
ここで同上データに対して重回帰分析を行うに際して注意すべき点が1つある。それは、重 回帰分析では原則として基準変数も説明変数もすべて定量的変数でなければならない、という 点である。これに対して、上記データの説明変数のうち lav, tav は定性的変数である。この ような場合、一般的には重回帰分析を行う前に、どの定性的変数についても ダミー変数化しておく必要がある。ダミー変数 (dummy variable) の作成については、本ホームページのロジスティック回帰分析の概要についての 4.5.1 節 ロジスティック回帰分析の データとモデルに詳しく記述してあるので、参考にされたい。ただし、高井のデータでは、 2つの定性的変数 lav, tav は、共に2値データでありかつ (0,1) 型になっており、最初から ダミー変数と同一のコーディングがなされているので、あらためてダミー変数化する必要はない。
最初の2本のプログラムではこれらすべての説明変数を対象として、SAS の重回帰分析におけ る多重共線性の検討のための1つのパラメータである collin オプ ション及び collinoint オプションを順に指定している。前者は、 重回帰方程式モデルのパラメータの1つであるモデルの定数項を含む場合、後者は同定数項を 含まない場合のオプションである。どちらを選択するべきかは、データの性質等に依存する。 ここでは、両方のオプションを順に指定し、出力結果を検討することとした。
つぎの2本の重回帰分析では、特性不安と状態不安の2変数の交互作用項を除いて同様の分 析を行ったものである。いずれにせよ、これら4本の重回帰分析プログラムで注意すべきは、す べてのプログラムでの基準変数は crest すなわち、正再認率というもとの定量的変数を上記2 つ目のデータ文で定性化した定性的変数である点である。このような定性的変数を重回帰分析 の基準変数とすることは、通常は正しくない。しかし、SAS の重回帰分析では、このような場 合でも基準変数があたかも定量的変数であるかのように扱って、通常の分析を行い、通常の重 回帰分析の結果を出力し、さらに多重共線性の指標を出力する。われわれが多重共線性を、基準 変数が定性的変数の場合(すなわち、本来はロジスティック回帰分析等を行うべき場合)に重 回帰分析を用いるときは、出力される通常の重回帰分析結果は無視し、同時に出力される多重 共線性関連の出力のみ見ればよい。その理由は、本来多重共線性は説明変 数間の特別な関連性に関わるものであり、基準変数には何ら関係がないからである。
最後に同上プログラムでは、基準変数を crest と指定してロジスティック回帰分析(logistic procedure)を2種類実行する。最初は、2つの定性的変数 lav, tav とそれらの交互作用、及び 2つの定量的変数 stanx, tranx 及びそれらの交互作用の合計6変数を説明変数とするロジス ティック回帰分析を、2つめは前者から stanx と tranx の交互作用を省いた5変数を説明変数 とする同解析である。ロジスティック回帰分析の SAS プログラムでは、説 明変数のうち定性的説明変数については、model 文の直前に class 文を用いてあらかじめ指定し ておく必要がある。また、ロジスティック回帰分析では重回帰分析 の SAS プログラムと異なり、説明変数間の交互作用については重回帰分析の場合のようにあら かじめ新たな変数として定義しておかず、同プログラムの model 文の右辺の説明変数のリス トを指定する中で、「*」印を用いて直接交互作用を定義することができる。
2) ロジスティック回帰分析の出力結果例1
|
上記の出力結果は、高井データで2つの定量的変数 stanx, tranx の交互作用項も含めた重回帰 分析で、前半がcollin パラメータを、後半が collinoint を指定した場合の結果である。共に、 結果を見ればわかるように、通常の重回帰分析の結果である重相関係数の検定や偏回帰係数の検定 に引き続いて、多重共線性の各種指標が示されている。最初の collin パラメータを指定した場合 の「共線性診断」の項の固有値と条件指標の値を見ると、最大条件指標の値は約 105.17 となって いる。この値は、Belsley et al. (1980) の基準からは説明変数間に強い共線性があることを示唆 している。一方、後半の collinoint パラメータを指定した場合には、同最大条件指標の値は約 17.74 となっており、説明変数間には弱い共線性しかないことがわかる。
つぎに、前者から stanx と tranx の交互作用を省いた5変数を説明変数 とする重回帰分析で 上と同様 collin 及び collinoint パラメータを指定した同分析を行った結果を示したのが、つぎ の出力である。
reg. of crest data with collin parameter and others 4 2016年 9月24日 土曜日 15時33分44秒 REG プロシジャ モデル : MODEL1 従属変数 : crest 読み込んだオブザベーション数 30 使用されたオブザベーション数 30 分散分析 要因 自由度 平方和 平均平方 F 値 Pr > F Model 5 1.95791 0.39158 1.70 0.1740 Error 24 5.54209 0.23092 Corrected Total 29 7.50000 Root MSE 0.48054 R2 乗 0.2611 従属変数の平均 1.50000 調整済み R2 乗 0.1071 変動係数 32.03611 パラメータ推定値 パラメータ 変数 自由度 推定値 標準誤差 t 値 Pr > |t| トレランス 分散拡大 Intercept 1 0.66514 0.50095 1.33 0.1967 . 0 lav 1 0.32730 0.24996 1.31 0.2028 0.49279 2.02925 tav 1 0.57250 0.25801 2.22 0.0362 0.46252 2.16205 lavtav 1 -0.27910 0.35333 -0.79 0.4373 0.34467 2.90131 stanx 1 -0.01326 0.01534 -0.86 0.3960 0.39789 2.51329 tranx 1 0.01990 0.01281 1.55 0.1334 0.39670 2.52078 共線性の診断 -------------------------------ばらつきの割合------------------------------- 数 固有値 条件指標 Intercept lav tav lavtav stanx tranx 1 4.48512 1.00000 0.00139 0.00801 0.00751 0.00635 0.00070618 0.00072851 2 0.84347 2.30596 0.00310 0.01680 0.01587 0.17940 0.00211 0.00225 3 0.53475 2.89610 6.332753E-9 0.22972 0.21569 3.640578E-7 0.00004011 0.00004128 4 0.10579 6.51140 0.00193 0.68268 0.63356 0.79525 0.00548 0.00867 5 0.02176 14.35772 0.99356 0.05370 0.05091 0.01240 0.10359 0.10833 6 0.00912 22.17338 0.00001751 0.00909 0.07644 0.00661 0.88808 0.87998 reg. of crest data with collinoint parameter and others 5 2016年 9月24日 土曜日 15時33分44秒 REG プロシジャ モデル : MODEL1 従属変数 : crest 読み込んだオブザベーション数 30 使用されたオブザベーション数 30 分散分析 要因 自由度 平方和 平均平方 F 値 Pr > F Model 5 1.95791 0.39158 1.70 0.1740 Error 24 5.54209 0.23092 Corrected Total 29 7.50000 Root MSE 0.48054 R2 乗 0.2611 従属変数の平均 1.50000 調整済み R2 乗 0.1071 変動係数 32.03611 パラメータ推定値 パラメータ 変数 自由度 推定値 標準誤差 t 値 Pr > |t| トレランス 分散拡大 Intercept 1 0.66514 0.50095 1.33 0.1967 . 0 lav 1 0.32730 0.24996 1.31 0.2028 0.49279 2.02925 tav 1 0.57250 0.25801 2.22 0.0362 0.46252 2.16205 lavtav 1 -0.27910 0.35333 -0.79 0.4373 0.34467 2.90131 stanx 1 -0.01326 0.01534 -0.86 0.3960 0.39789 2.51329 tranx 1 0.01990 0.01281 1.55 0.1334 0.39670 2.52078 共線性診断 (切片の調整済み) ---------------------------ばらつきの割合-------------------------- 数 固有値 条件指標 lav tav lavtav stanx tranx 1 1.94303 1.00000 0.03026 0.02887 0.04798 0.04842 0.05154 2 1.54416 1.12175 0.03709 0.03690 0.05563 0.06876 0.06282 3 1.10944 1.32339 0.21317 0.19678 0.00003472 0.00826 0.00892 4 0.22604 2.93189 0.25933 0.00737 0.13436 0.68528 0.70203 5 0.17733 3.31012 0.46015 0.73008 0.76199 0.18928 0.17469
|
2つの不安の2尺度の交互作用を含めた場合の重回帰分析と同様に、collin 及び collinoint パラメータを指定した場合の出力結果の条件指標を見ると、それぞれ順に約 22.17 及び 3.31 と なっている。交互作用を含めない場合には、説明変数間に強い共線性は見られないことがわかる。 これらの結果からは、基準変数を crest とする場合には、不安2尺度の交互作用項をロジスティック 回帰分析では外した方がよさそうなことが示唆される。
しかしながら、ここでは念のため説明変数として不安2尺度の交互作用項を含めた場合と含めない 場合の両方でロジスティック回帰分析を行ってみた。これらが、上記の SAS プログラムの最後の 2つの proc logistic による解析である。出力結果は以下の通りである。
logistic reg. (1) for vars. including the interaction/resp=crest 6 2016年 9月24日 土曜日 15時33分44秒 LOGISTIC プロシジャ モデルの情報 データセット WORK.TEMP1 応答変数 crest 応答の水準数 2 モデル binary logit 最適化の手法 Newton-Raphson 読み込んだオブザベーション 30 使用されたオブザベーション 30 反応プロファイル 順番 crest 度数の合計 1 1 15 2 2 15 モデルの確率基準は crest=1 です。 分類変数の水準の情報 分類 値 デザイン変数 lav 0 1 1 -1 tav 0 1 1 -1 モデル収束状態 収束基準(GCONV=1E-8)は満たされました。 モデルの適合度統計量 基準 切片のみ 切片と共変量 AIC 43.589 46.280 SC 44.990 56.088 -2 Log L 41.589 32.280 logistic reg. (1) for vars. including the interaction/resp=crest 7 2016年 9月24日 土曜日 15時33分44秒 LOGISTIC プロシジャ 包括的帰無仮説: BETA=0 の検定 検定 カイ 2 乗値 自由度 Pr > ChiSq 尤度比 9.3092 6 0.1569 スコア 7.8349 6 0.2504 Wald 5.1317 6 0.5270 Joint 検定 Wald 効果 自由度 カイ 2 乗 Pr > ChiSq lav 1 1.5294 0.2162 tav 1 4.4744 0.0344 lav*tav 1 0.9870 0.3205 stanx 1 0.1924 0.6609 tranx 1 0.4204 0.5168 stanx*tranx 1 0.0159 0.8996 NOTE: Under full-rank parameterizations, Type 3 effect tests are replaced by joint tests. The joint test for an effect is a test that all the parameters associated with that effect are zero. Such joint tests might not be equivalent to Type 3 effect tests under GLM parameterization. 最尤推定値の分析 Wald パラメータ 自由度 推定値 標準誤差 カイ 2 乗 Pr > ChiSq Intercept 1 1.6869 9.1655 0.0339 0.8540 lav 0 1 0.5890 0.4763 1.5294 0.2162 tav 0 1 1.2374 0.5850 4.4744 0.0344 lav*tav 0 0 1 0.5003 0.5036 0.9870 0.3205 stanx 1 0.1121 0.2555 0.1924 0.6609 tranx 1 -0.1017 0.1569 0.4204 0.5168 stanx*tranx 1 -0.00049 0.00385 0.0159 0.8996 予測確率と観測データの応答との関連性 一致の割合 76.0 Somers の D 0.520 不一致の割合 24.0 ガンマ 0.520 タイの割合 0.0 Tau-a 0.269 組 225 c 0.760 パラメータ推定とプロファイル尤度による信頼区間 パラメータ 推定値 95% 信頼限界 Intercept 1.6869 -16.1940 21.6313 lav 0 0.5890 -0.2935 1.6550 tav 0 1.2374 0.2465 2.6477 logistic reg. (1) for vars. including the interaction/resp=crest 8 2016年 9月24日 土曜日 15時33分44秒 LOGISTIC プロシジャ パラメータ推定とプロファイル尤度による信頼区間 パラメータ 推定値 95% 信頼限界 lav*tav 0 0 0.5003 -0.4208 1.6671 stanx 0.1121 -0.4053 0.6329 tranx -0.1017 -0.4404 0.2096 stanx*tranx -0.00049 -0.00831 0.00746 logistic reg. (2) for correst recognition data/resp=crest 9 2016年 9月24日 土曜日 15時33分44秒 LOGISTIC プロシジャ モデルの情報 データセット WORK.TEMP1 応答変数 crest 応答の水準数 2 モデル binary logit 最適化の手法 Newton-Raphson 読み込んだオブザベーション 30 使用されたオブザベーション 30 反応プロファイル 順番 crest 度数の合計 1 1 15 2 2 15 モデルの確率基準は crest=1 です。 分類変数の水準の情報 分類 値 デザイン変数 lav 0 1 1 -1 tav 0 1 1 -1 モデル収束状態 収束基準(GCONV=1E-8)は満たされました。 モデルの適合度統計量 基準 切片のみ 切片と共変量 AIC 43.589 44.295 SC 44.990 52.703 -2 Log L 41.589 32.295 logistic reg. (2) for correst recognition data/resp=crest 10 2016年 9月24日 土曜日 15時33分44秒 LOGISTIC プロシジャ 包括的帰無仮説: BETA=0 の検定 検定 カイ 2 乗値 自由度 Pr > ChiSq 尤度比 9.2934 5 0.0979 スコア 7.8317 5 0.1658 Wald 5.1811 5 0.3942 Joint 検定 Wald 効果 自由度 カイ 2 乗 Pr > ChiSq lav 1 1.5391 0.2148 tav 1 4.5780 0.0324 lav*tav 1 0.9809 0.3220 stanx 1 1.0922 0.2960 tranx 1 2.7340 0.0982 NOTE: Under full-rank parameterizations, Type 3 effect tests are replaced by joint tests. The joint test for an effect is a test that all the parameters associated with that effect are zero. Such joint tests might not be equivalent to Type 3 effect tests under GLM parameterization. 最尤推定値の分析 Wald パラメータ 自由度 推定値 標準誤差 カイ 2 乗 Pr > ChiSq Intercept 1 2.8037 2.4740 1.2843 0.2571 lav 0 1 0.5892 0.4750 1.5391 0.2148 tav 0 1 1.2238 0.5720 4.5780 0.0324 lav*tav 0 0 1 0.4890 0.4937 0.9809 0.3220 stanx 1 0.0814 0.0779 1.0922 0.2960 tranx 1 -0.1193 0.0722 2.7340 0.0982 オッズ比の推定 95% Wald 効果 点推定 信頼限界 stanx 1.085 0.931 1.264 tranx 0.888 0.770 1.022 予測確率と観測データの応答との関連性 一致の割合 75.6 Somers の D 0.511 不一致の割合 24.4 ガンマ 0.511 タイの割合 0.0 Tau-a 0.264 組 225 c 0.756 logistic reg. (2) for correst recognition data/resp=crest 11 2016年 9月24日 土曜日 15時33分44秒 LOGISTIC プロシジャ パラメータ推定とプロファイル尤度による信頼区間 パラメータ 推定値 95% 信頼限界 Intercept 2.8037 -1.7479 8.3922 lav 0 0.5892 -0.2913 1.6506 tav 0 1.2238 0.2496 2.6031 lav*tav 0 0 0.4890 -0.4167 1.6291 stanx 0.0814 -0.0706 0.2491 tranx -0.1193 -0.2862 0.0113
|
上記の不安2尺度の交互作用項を含めた場合と含めない場合の2種類のロジスティック回帰 分析における出力結果の中の「包括的帰無仮説: BETA=0 の検定」 の項を見ると、これらのモデルに対する尤度比検定の結果の p-値は、それぞれ順に 0.1569 及び 0.0979 となり、共に かろうじて有意な傾向があることがわかる。一方、「包括的帰無仮説: BETA=0 の検定」の項の1つ前の「モデルの適合度統計量」 の項の AIC (Akaike's Information Criterion) の値を見ると、 不安2尺度の交互作用項を含めた場合と含めない場合の2種類のロジスティック回帰分析に おけるモデルの適合度の指標の1つである AIC は、順に 46.280 及び 44.295 となっており、交互作用項を含めない方がより良 いモデルであることが示唆される。
これまでの重回帰分析による多重共線性の検討結果とロジスティック回帰分析の結果に おける情報量基準 AIC による検討結果を総合すると、基準変数を crest とした場合の ロジスティック回帰分析には不安2尺度の交互作用項は含めない方がよいと考えた方が よさそうである。そこで、最後に上記一連の SAS プログラムの最後の出力結果である 不安2尺度の交互作用項を含めない場合のロジスティック回帰分析の結果のうちの 「Joint 検定」の項を見ると、p-値から説明変数 tav が 5パーセント水準で有意であることと、tranx が有意な傾向にあることがわかる。
そこで、つぎにこれら2変数が crest すなわち 正再認率の高低(1、高群/2、低群)にどのように効いているのかを、tav すなわち再認 モダリティの高低(もとの入力値では、0、視覚呈示/1、聴覚呈示)および tranx すなわ ち特性不安の高低(定量変数)ごとに、後続の出力である「最尤推定値の分析」の項の対応 するモデルパラメータの推定値を見ることにより検討した。まず、再認モダリティの高低は、 もとの入力値は視覚呈示を0、聴覚呈示を1としたが、SAS の解析プログラムでは前者が1、 後者は-1と変換されていることが、出力結果の「分類変数の水準の情報」の項に表示され ていることに注意しよう。この点に注意しながら出力結果の中の「 最尤推定値の分析」の項の tav 変数に対する重み係数の推定値を見ると約 1.22 であることから、学習後の再認時に刺激を視覚呈示され たときは、聴覚呈示されたときよりも実験参加者の正再認率は高くなることがわかる。一 方、tranx すなわち特性不安得点の高低については、これに対する重み係数のすいて値は約 -0.12 である。その結果、特性不安が高い実験参加者は低い実験 参加者に比べて、正再認率は低くなる傾向があることがわかる。最後に出力結果の 「オッズ比の推定」結果を見ると、オッズ比は両説明変数共、 95 パーセント信頼区間が1を跨いでいることがわかる。この結果は、両説明変数の 効果があるとは言い切れないことを示唆しているが、もともと最初に指摘したように、 crest に対するロジスティック回帰分析のモデルの適合度が、有意ではなく有意な傾向を 示していたに過ぎないことを考慮するとやむを得ないであろう。