2.8.3節  筆跡データの補足的分析とその見方

Eric's eye-bar icon

 この節は、つぎの2項から成り立っています:

1.筆跡データの補足的分析のためのプログラム
2. 筆跡データの補足的分析の出力結果とその見方

 この節には、つぎの SAS プログラムのダウンロードコーナーを用意してあります:

重回帰分析用プログラムの例3

Eric's eye-bar icon

 1)筆跡データの補足的分析のためのプログラム

  これまで、筆跡データに対して重回帰分析を中心に検討してきた。しかし、これ までの分析は、性格検査や評定尺度の得点の分布の形については何も検討して来 なかった。既に理論のところで見たように、重回帰分析では通常説明ないし予測 変数には正規性を仮定せず、むしろ定数として扱うが、誤差項には正規分布を仮 定する。したがって、結果として基準変数には必然的に正規分布が仮定される。

  このようなわけで、われわれは重回帰分析を行い、重相関係数が有意ならば、 さらに偏回帰係数の検定を行うという、ルーチン的な検討をすればそれで重回帰 分析は完了した、と簡単には言えないのである。われわれは、最低限、推定された 誤差(残差ともいう)の分布が正規分布に従っていたのかどうかを事後的に検討 するとよい。

  また、筆跡の第3因子である筆跡の滑らかさのレベルが、2種類の性格 検査の下位尺度によりある程度説明できることがわかったが、それらの関係は具体的に どのようになっているのかは重相関係数の値のみではわかりにくい。また、被験者 の中には、モデルにフィットしない者もいるはずであるが、各被験者のモデルか らのずれを視覚化できないであろうか。

  さらに、筆跡の第3因子にほぼ4つの変数が効いていること が通常の重回帰分析により明らかになったが、ほかの方法でも同様な結果になるので あろうか。この点を検討するには、各種の変数ないしはモデル選択の方法を用いれ ばよい。

  つぎのプログラムは、これらのことを補足的に分析するためのものである。また、 プログラムが長すぎるので、ここでは省略したが、前節の最後に行った筆跡の因子 と YG 性格の因子との間に非線形な関係は見られないのであろうか。この点も最後に 検討する:

*---------------------------------------------------------------------*
|                                                    October 22, 1998 |
|  sas program--mreg_ex3.sas--                                        |
|       example 2 of sas programs for multiple regression.            |
|                                                                     |
|  file name: $HOME/sasprog/multivar/mreg_ex3.sas                     |
|                                                                     |
*---------------------------------------------------------------------*;
libname sasfile '$HOME/sasset/others';
options pagesize=30;
  title 'histogram for the holograph data';
proc chart data=sasfile.Fujiiraw;
  vbar inv1-inv5 yg1-yg12 img1-img29;
run;
options pagesize=60;
  title 'test for normality';
proc univariate data=sasfile.Fujiiraw normal;
  var inv1-inv5 yg1-yg12 img1-img29;
run;
  title 'principal FA for the holograph data';
proc factor data=sasfile.Fujiiraw
  /* method options */ method=p priors=max n=5 rotate=v
  /* output options */ score outstat=factout;
  var img1-img29;
run;
proc score data=sasfile.Fujiiraw score=factout out=scores;
run;
options pagesize=30;
  title 'multiple regressions for the Fujii data';
proc reg data=scores;
  model factor3=inv1-inv5 yg1-yg12;
  plot predicted.*factor3;
  plot residual.*obs.;
  plot h.*obs.;
  plot cookd.*obs.;
  plot dffits.*obs.;
  output out=resfile r=resid;
run;
  title 'histogram for residuals';
proc chart data=resfile;
  vbar resid;
run;
options pagesize=60;
  title 'test for normality of the residuals';
proc univariate data=resfile normal;
  var resid;
run;
  title 'model selection in multivariate regression';
proc reg data=scores;
  model factor3=inv1-inv5 yg1-yg12
                / aic selection=rsquare start=2;
run;
quit;

--- 筆跡データの補足的分析のための SAS プログラム ---

プログラムのダウンロード・コーナー

Eric's abar10 icon

mreg_ex3.sas

Eric's back icon

  まず、最初の chart プロシジャは、2種類の性格検査の下位尺度の各々と、筆跡 の29尺度のそれぞれについて、ヒストグラムを描かせるためのものである。

  つぎの univariate プロシジャは、定量変数に対して平均、標準偏差、分散、歪度、 尖度、範囲、Q1(第1四分位数)、Mdn(中央値)、Q3(第3四分位数)、Mode(最 頻値)、箱ひげ図、正規確率プロットの作成、など1変量基礎統計量を求めるための プロシジャであるが、ここではこれを正規分布への適合性の検定のために用いた。

  つぎの factor プロシジャ及び score プロシジャについては、省略する。

  つぎの reg プロシジャでは、前節の解析で重相関係数が統計的に有意の傾向に あった筆跡の第3因子のみを基準変数とする重回帰分析を再度行っている。ただし、 ここではさらに、筆跡の第3因子の予測値(SAS ではこれを predicted.と記述する) を縦軸にし、第3因子の因子得点を横軸に取り、両者の関係を平面上にプロットさ せるために、重回帰分析用の plot 文を使っている。また、同じく plot 文を使っ て、実測値と予測値の差(残差)を縦軸に取り、被験者の通し番号(SAS では、こ れは obs. と記述する)を横軸にとって、各サンプルをプロットさせる。 。また、同じく plot 文を使っ て、実測値と予測値の差(残差)、てこ比、{\gt クックの $D$ 測度} (Cook's D measure) (Cook, 1977, 1979)、{\gt DFFITS 統計量} (DFFITS statistic) (Belsley, Kuh, \& Welsch, 1980) を縦軸に取り、被験者の通し番号(SAS では、こ れは obs. と記述する)を横軸にとって、各サンプルをプロットさせる。 さらに、後続の残差の正規性検定のため、output 文で残差を一時ファイル resfile に、 resid なる変数名で保存する。

  つぎの chart プロシジャと univariate プロシジャとで、一時ファイルから 受け取った残差をヒストグラムに描き、残差の正規性検定を行う。

  最後の reg プロシジャは、SAS の重回帰分析のモデル選択の1つの方法を使い、 筆跡の第3因子の規定因を再検討するためのものである。aic オプションは、赤池 (1973) の AIC 基準の計算を指定するものである。また、selection=rsquare は、 幾つかのモデル選択の1つの方法で、説明ないし予測変数の数を固定した時重相関 係数の2乗が最大になるモデルを選択する方法である。start=2 では、説明ないし 予測変数の数を2から始めることを指示している。

  SAS では、この他にも調整 $R^2$ 選択法、マローの Cp 選択法、前進選択法、 後退消去法、逐次的方法などの幾つかのモデル選択の方法を用意しているが、AIC 基 準はここでの $R^2$ 選択法、調整 $R^2$ 選択法、マローの Cp 選択法の場合しか 計算しないので、注意が必要である。

Eric's back icon

 2)筆跡データの補足的分析の結果とその見方

  上述の一連のプログラムを実行させると、つぎのような結果が得られる:

  1. chart プロシジャによる性格検査と筆跡の評定尺度のヒス トグラム

      まず、INV では、つぎに示す第2尺度(E 粘着性)のみが、後続の univariate プロシジャにより、正規分布に従わないことがわかった。

    
      度数
    
         |                      *****
      10 +             *****    *****    *****
         |             *****    *****    *****
         |             *****    *****    *****
         |             *****    *****    *****
         |             *****    *****    *****    *****    *****
       5 +             *****    *****    *****    *****    *****    *****
         |             *****    *****    *****    *****    *****    *****
         |             *****    *****    *****    *****    *****    *****
         |    *****    *****    *****    *****    *****    *****    *****
         |    *****    *****    *****    *****    *****    *****    *****
         --------------------------------------------------------------------
               0.0      2.5      5.0      7.5      10.0     12.5     15.0
    
                                      INV2 中間点
    

    --- INV の第2尺度(粘着性)のヒストグラム(正規分布に従わない)---

      つぎに、YG 性格検査の12の下位尺度では、やはり後続の解析で正規分布に従 わないと見做されたものが傾向程度のものも含めると半数あった。はっきりと正規 性が棄却された尺度は、第10、11、及び12尺度である。これに対して、その 傾向のあった尺度は、第1、2、及び4尺度である。ここでは、第12尺度 (社会 的外向性 social extroversion)の分布のみを示す。

    度数
    
       |                            *****
       |                            *****
       |                            *****
       |                            *****                            *****
    10 +                            *****                 *****      *****
       |                            *****                 *****      *****
       |                            *****                 *****      *****
       |                 *****      *****      *****      *****      *****
       |                 *****      *****      *****      *****      *****
     5 +                 *****      *****      *****      *****      *****
       |                 *****      *****      *****      *****      *****
       |                 *****      *****      *****      *****      *****
       |                 *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       -------------------------------------------------------------------------
               4.5        7.5        10.5       13.5       16.5       19.5
    
                                 social extroversion 
    

    --- YG の第12尺度(社会的外向性)のヒストグラム(正規分布に従わない)---

      筆跡の29項目とりわけ28の評定尺度の分布については、後続の検定で正規性が 棄却されたものが8尺度($img4,\,img7,\,img11,\,img18,\,img20,\,img23,\,img24, \,img26$)、棄却の傾向のある尺度が4尺度($img1,\,img3,\,img8,\,img9$)の合計 12尺度であった。ここでは、それらのうち img7、img23、及び img26 についてのみ 示す。

    度数
    
       |                                                  *****
       |                                                  *****
       |                                       *****      *****
    10 +                                       *****      *****
       |                            *****      *****      *****
       |                 *****      *****      *****      *****
       |                 *****      *****      *****      *****
       |                 *****      *****      *****      *****
     5 +      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       -------------------------------------------------------------------------
               2.4        3.2        4.0        4.8        5.6        6.4
    
                                      IMG7 中間点
    

    --- IMG の第7尺度(行がまっすぐー曲がっている)のヒストグラム(正 規分布に従わない)---

      上の分布形は、理論分布としてあまりなじみがない形をしている。

      度数
    
         |                      *****
      15 +             *****    *****
         |             *****    *****
         |             *****    *****
         |             *****    *****
         |             *****    *****
      10 +             *****    *****
         |             *****    *****
         |             *****    *****
         |             *****    *****
         |    *****    *****    *****    *****
       5 +    *****    *****    *****    *****
         |    *****    *****    *****    *****    *****
         |    *****    *****    *****    *****    *****
         |    *****    *****    *****    *****    *****    *****
         |    *****    *****    *****    *****    *****    *****    *****
         --------------------------------------------------------------------
               2.1      2.7      3.3      3.9      4.5      5.1      5.7
    
                                     IMG23 中間点
    

    --- IMG の第23尺度(文の始めと終わりで字が変るー変らない)のヒス トグラム(正規分布に従わない)---

      上の分布は、$\chi^2$-分布や F-分布に似た非対称な分布にみえる。

    度数
    
       |                                                  *****
       |                                                  *****
       |                                                  *****
       |                            *****                 *****
    10 +                            *****                 *****
       |                            *****      *****      *****
       |      *****                 *****      *****      *****
       |      *****                 *****      *****      *****
       |      *****                 *****      *****      *****
     5 +      *****                 *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       -------------------------------------------------------------------------
               2.0        2.8        3.6        4.4        5.2        6.0
    
                                      IMG26 中間点
    

    --- IMG の第26尺度(読みやすいー読みにくい)のヒストグラム(正規 分布に従わない)---

      上の分布は、山が3つもある複雑な分布である。

  2. univariate プロシジャによる性格検査と筆跡の評定尺度の正規 性の検定結果

      つぎに出力されるのは、univariate プロシジャによる性格検査と筆跡の評定尺度 それぞれの正規性の検定結果である。その結果については、既にうえのヒストグラム のところで述べたので、ここでは univariate プロシジャによる出力の内容について のみ説明する。

                                Univariate Procedure
    
    Variable=INV1
    
                                      Moments
    
                      N                50  Sum Wgts         50
                      Mean           10.5  Sum             525
                      Std Dev     3.48905  Variance   12.17347
                      Skewness   -0.06607  Kurtosis   0.341143
                      USS            6109  CSS           596.5
                      CV         33.22905  Std Mean   0.493426
                      T:Mean=0   21.27978  Prob>|T|     0.0001
                      Num ^= 0         50  Num > 0          50
                      M(Sign)          25  Prob>|M|     0.0001
                      Sgn Rank      637.5  Prob>|S|     0.0001
                      W:Normal   0.977411  Prob
      

    --- univariate プロシジャによる性格検査と筆跡の評定尺度の 正規性の検定結果 (INV1 の場合)---

      このセクションには、平均 (mean)、標準偏差 (Std Dev)、分散 (Variance)、 歪度 (skewness)、尖度 (kurtosis)、母平均がゼロかどうかの t-検定における t 値 (T:Mean=0)及び検定結果 (Prob $> \mid T \mid$)、正規性の検定のための 統計量(サンプルサイズが 2000 以下の場合、Shapiro-Wilk 統計量、Shapiro \& Wilk, 1965、が用いられる。W 統計量がゼロに近いと正規性を棄却する。もし、 サンプルサイズが 2000 より大な場合には、Kolmogorov の D 統計量が用いられる) 、ここでは W 統計量 (W:Normal)、及びその検定結果、ここでは (Prob $<$ W) 等が 表示されている。この Prob $<$ W の値が 0.6322 と、0.05 (5%水準)より大きい ので、INV1 なる尺度の分布は正規分布に従う母集団からのサンプルと見做す。もし、 この値が 0.05 よりも小さければ、正規性を棄却する。

      この出力には、さらに四分位数 (Quantiles)などの基礎統計も印刷される。

  3. 筆跡の29尺度の因子分析結果

      これについては、既に前節で説明したので省略する。

  4. 筆跡の第3因子を基準変数とする補足的重回帰分析

      ここでは、前節の分析で重相関係数が有意の傾向にあった筆跡の第3因子を基準 変数とする重回帰分析のみを再度実行させ、第3因子すなわち筆跡の滑らかさのレベル の実測値(実際には、因子分析によるその推定値)とモデルによる予測値との間の 乖離の有無を、予測値を縦軸に取り実測値を横軸に取りプロットさせる。

      これを眺めることにより、われわれはモデルの適合の程度を統計的検定のみでなく 視覚的にも確認できる。また、実測値とモデルによる予測値との間の乖離が際立っ て大きいサンプルがいれば、そのサンプルに戻り乖離の原因を推定できるかもしれ ない。

      つぎの図はプロットの結果である。これを見る限り、実測値と予測値との乖離が それほどひどいサンプルは見当たらない。

             -----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----
    P PRED   |                                                               |
    r        |                                                               |
    e      2 +                                                               +
    d        |                                                               |
    i        |                                                      1        |
    c        |                                       1                       |
    t      1 +                                             11                +
    e        |                                             1  11             |
    d        |                  1             11         2         1         |
             |                               2 2     11  1 1                 |
    V      0 +                      1          311     2    1      1         +
    a        |                             1    2  2       1                 |
    l        |         1            2  1           1                         |
    u        |         1    1                                                |
    e     -1 +                   1  1  1           1                         +
             |               1                                               |
    o        |                                                               |
    f        |             1                                                 |
          -2 +                                                               +
    F        |                                                               |
    A        -----+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----
    C           -2.5  -2.0  -1.5  -1.0  -0.5   0.0   0.5   1.0   1.5   2.0
    T
                                          FACTOR3
    

    --- 第3因子の因子得点(横軸)とその予測値との関係についての散布図 ---

      もう1つの事後的、補足的分析は、実測値(第3因子の因子得点)と予測値との 差、すなわち残差がサンプルとの関係でどうなっているかの検討である。 前述の reg プロシジャのプログラムの中の2つ目の plot 文により、つぎのような 出力が得られる。

             --+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
    RESIDUAL |                                                               |
           2 +                                                               +
             |                                                               |
             |                                   1                           |
             |           1                 1                                 |
             |                                                           1   |
    R        |                     1                                         |
    e        |  1          1                      1                1         |
    s        |                           1   1                  11   1    1  |
    i        |                       111                      1        1     |
    d      0 +      1     1 1  1  1     1            1     1 1 1      1      +
    u        |     1             1          1          1                     |
    a        |   1     1                       1        11                   |
    l        |                                     1      1         1      1 |
             |        1                       1                              |
             |                  1                                            |
             |                                      1                        |
             |       1                                                       |
             |               1                                               |
          -2 +                                                               +
             --+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
               0     5    10    15    20    25    30    35    40    45    50
    
                               Observation Number   OBS NUM
    

    --- 基準変数の残差とサンプル通し番号との関係についての散布図 ---

      この結果を見ると、どのサンプルの残差がどれほどであったかがわかりやすく 表示されている。このプロットは、もしサンプルが縦断的な観測点だとすると、自己 相関の有無を検討するためにも役立つ。

      同様に、残差分析の方法の例として、てこ比、クックの D 測度、及び DFFITS 統計量をそれぞれ縦軸に取り、横軸にサンプル番号を取る分析結果を順に示す:

               -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
      H        |                                                              |
           0.6 +                                                              +
               |                   1    1                                     |
               |                                                              |
               |        1                       1                   1         |
               |                                   1      1            1   1  |
    L          |    1 1   11          1        1     1  1      1     1        |
    e      0.4 +                       1                   11    1            +
    v          |                                         1                    |
    e          |     1       1      1    1            1         1     1       |
    r          |  1         1 1 1         1  1      1                         |
    a          |                  1         1     1                     1   1 |
    g          |                 1                            1               |
    e      0.2 + 1     1                                          1       1   +
               |                              1                               |
               |                                                              |
               |                                                              |
               |                                                              |
               |                                                              |
           0.0 +                                                              +
               -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
                0     5    10    15    20    25    30    35    40    45    50
    
                                Observation Number   OBS NUM
    

    --- てこ比とサンプル通し番号との関係についての散布図 ---

               -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
    C COOKD    |                                                              |
    o      0.3 +                                                              +
    o          |                                                              |
    k          |                                                              |
    '          |                                                              |
    s          |      1                                                       |
               |                                                              |
    D      0.2 +                                                              +
               |          1                                                   |
    I          |                                                              |
    n          |                                     1                        |
    f          |              1                                               |
    l          |                                                              |
    u      0.1 +                               1  1                           +
    e          |                                                              |
    n          |                            1                                 |
    c          |                    1              1                1         |
    e          |            1    1                         1         1        |
               | 1  1  11               1       1   1    11      1    1   111 |
    S      0.0 +  1  1     1 1  1 11  11 11  11       1 1   1 111 1    11     +
    t          -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
    a           0     5    10    15    20    25    30    35    40    45    50
    t
                                Observation Number   OBS NUM
    

    --- クックの $D$ 測度とサンプル通し番号との関係についての散布図 ---

               -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
    S DFFITS   |                                                              |
    t        2 +          1                                                   +
    a          |                                                              |
    n          |                                  1                           |
    d          |                    1       1      1                1         |
    a          |            1                                         1   11  |
    r          | 1                    111 1   1                1 11           |
    d        0 +     1     1 1  1 11     1   1        1 1   1 1 1      11     +
               |  1 1                                                       1 |
    I          |       11                       1   1    111         1        |
    n          |                 1                                            |
    f          |                               1                              |
    l          |              1                      1                        |
    u       -2 +                                                              +
    e          |      1                                                       |
    n          |                                                              |
    c          |                                                              |
    e          |                                                              |
               |                                                              |
    o       -4 +                                                              +
    n          -+-----+-----+-----+-----+-----+-----+-----+-----+-----+-----+--
                0     5    10    15    20    25    30    35    40    45    50
    P
                                Observation Number   OBS NUM
    

    --- DFFITS 統計量とサンプル通し番号との関係についての散布図 ---

      ここで、てこ比の限界値は、2.6 節の定義式より $2q/N=2(17+1)/50=0.72$ となる。 また、クックの D 測度(図中 COOKD と表記)は、 % \[ D_i={( \hat{\mbbeta}-\hat{\mbbeta}_{(i)} )}^t \mbX^t \mbX ( \hat{\mbbeta}-\hat{\mbbeta}_{(i)} )/(qs^2), \] % として定義される (Cook, 1979)。ここで、$s^2$ はモデルの誤差分散の推定値であ る。また、$D_i$ は F-分布 $F_{q+1 \atop N-q-1}$ の棄却点で評価ができる。また、 $\hat{\mbbeta}_{(i)}$ は、 被験者 $i$ をはずした時の推定回帰係数ベクトルである。最後の DFFITS は、 $DFFITS=( \hat{\mby}_i - \hat{\mby}(i) )/( s(i)/\sqrt{h_i} )$ として定義 され、$\mid DFFITS \mid > 2$ が外れ値の基準とされる。ここで、$\hat{\mby}(i)$ 及び $s(i)$ は、被験者 $i$ をはずして回帰係数を求めそれにより計算した基準 変数の予測値及び同じく被験者 $i$ をはずして計算した誤差分散の推定値である。

  5. 筆跡の第3因子の残差のヒストグラムと正規性の検定結果

      つぎの結果は、筆跡の第3因子の残差の分布が正規性を満たしているかどうかを 検討するためのもので、最初にヒストグラムをつぎに正規性の検定結果を出力する。

    度数
    
       |                                       *****
       |                                       *****
       |                            *****      *****
       |                            *****      *****
    15 +                            *****      *****
       |                            *****      *****
       |                            *****      *****
       |                            *****      *****
       |                            *****      *****
    10 +                            *****      *****
       |                            *****      *****
       |                            *****      *****
       |                            *****      *****
       |                            *****      *****
     5 +                            *****      *****
       |                 *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       |      *****      *****      *****      *****      *****      *****
       -------------------------------------------------------------------------
               -1.5       -0.9       -0.3       0.3        0.9        1.5
    
                                    Residual
      

    --- 筆跡の第3因子の重回帰分析による残差のヒストグラム ---

      この分布が、正規分布に従う母集団からのサンプルかどうかを univariate プ ロシジャで行ったところ、Shapiro-Wilk 統計量 W (W:Normal) は 0.983522、 Prob $<$ W の値は 0.8476 となり、この分布は正規分布母集団からのサンプルと 見做せることがわかった。univariateプロシジャの出力結果は、省略する。

  6. 筆跡の第3因子のモデル選択

      つぎの結果は、筆跡の第3因子を基準変数とした場合の説明ないし予測変数を その数を固定して選択する方法の1つを使った結果である。上述の通常の重回帰分析 では、有意な変数は2つであったので、ここでは説明ないし予測変数を2に固定した 場合から順次その数を増やしていってみることにした。つぎに示すのは、出力結果の うちの変数が3の場合までの結果である。

     N = 50     Regression Models for Dependent Variable: FACTOR3
    
    
            R-square       AIC  Variables in Model
      In
    
         2  0.189674   -9.6636  YG2 YG12
         2  0.181561   -9.1655  INV2 INV5
         2  0.159520   -7.8367  YG2 YG11
         2  0.145242   -6.9945  INV2 YG12
         2  0.138580   -6.6063  INV5 YG2
         2  0.137293   -6.5316  INV2 YG11
         2  0.135576   -6.4323  YG2 YG4
         2  0.129706   -6.0938  YG1 YG12
         2  0.128806   -6.0422  INV2 YG4
         2  0.128298   -6.0130  YG1 YG11
         2  0.128023   -5.9973  INV2 YG10
         2  0.121074   -5.6004  YG8 YG12
         2  0.120740   -5.5814  YG8 YG11
         2  0.114524   -5.2291  YG9 YG12
         2  0.112273   -5.1022  INV4 INV5
         2  0.112056   -5.0900  INV3 YG12
         2  0.111201   -5.0418  INV5 YG12
    -------------------------------------
         3  0.240810  -10.9228  INV5 YG2 YG12
         3  0.237491  -10.7047  INV2 YG2 YG4
         3  0.235095  -10.5479  INV2 INV5 YG2
         3  0.233144  -10.4204  YG2 YG4 YG12
         3  0.228588  -10.1243  YG2 YG6 YG12
         3  0.226349   -9.9794  YG2 YG5 YG12
         3  0.220970   -9.6329  INV2 INV5 YG10
         3  0.215663   -9.2935  INV2 INV5 YG8
         3  0.209303   -8.8897  INV3 YG2 YG12
         3  0.204876   -8.6105  INV2 INV5 YG12
         3  0.204624   -8.5947  YG2 YG10 YG12
         3  0.202839   -8.4826  INV5 YG2 YG11
         3  0.201971   -8.4282  INV2 YG2 YG12
         3  0.201801   -8.4175  INV2 INV5 YG9
         3  0.201268   -8.3841  INV2 INV5 YG1
         3  0.200428   -8.3316  YG2 YG11 YG12
         3  0.199155   -8.2520  YG2 YG3 YG12
         

    --- 筆跡の第3因子を基準変数とした場合の重回帰におけるモデル選択の結果 ---

      上の結果をみると、説明ないし予測変数の数を固定した場合には、重相関係数 の2乗 (R square) を最大にするようにして計算された幾つかのモデルについて の AIC の値の(小ささの順位)は、重相関係数の2乗の(大きさの)順位と完全に 一致していることがわかる。この結果は、(2.75) 式の AIC の重回帰分析の文脈での 定義式及び、(2.27) 式と (2.28) 式から $s_e^2$ が $s_y^2\,(1-R^2)$ と書ける ことに注意すれば明らかである。AIC は、説明ないし予測変数の数が異なる 場合のモデルの良さの比較時に重要な役割を果すのである。

      いずれにせよ、この場合は2変数ならば、R の2乗が最大で AIC が最小のモデルは YG2 と YG12 を説明ないし予測変数とするモデルであること、3変数ならば、INV5、 YG2 及び YG12 を説明ないし予測変数とするモデルが最も良いモデルであるといえる。 この結果は、上述の通常の重回帰分析の結果とほぼ同じものである。

  7. 筆跡の因子と YG 性格の因子間の非線形な関係の有 無の検討

      前節の分析で筆跡の因子と YG 性格の因子間の(単)相関を検討した結果では、 相関係数が有意だったのは、YG の第2因子と筆跡の第3因子のみであった。しかし、 この結果は、あくまでも相関係数から見た結果でしかなく、変数(因子)間の直線 的関係のみについてである。したがって、因子間の関係をより詳しく検討するには、 これだけでは不十分と言わねばなるまい。言い換えれば、因子間にはひょとしたら 非線形な関係が見られるかもしれないのである。これを検討する1つの簡単な方法 は、相関関係が見られなかった因子間についても、散布図を描いてみることである。

      そのためには、2)の筆跡データの重回帰分析及び因子間相関プログラムの最後 に、つぎのような plot プロシジャを追加してやればよい;

       options pagesize=30;
       proc plot data=allfact;
         plot ygf1*(imgf1-imgf5);
         plot ygf2*(imgf1-imgf5);
       run;
       

      うえのプログラムにより得られた結果のうち、まず前節のプログラムで因子間に 有意な相関関係のみられた YG の第2因子と筆跡の第3因子の散布図を示すと、 つぎのようになる;

              プロット : YGF2*IMGF3.  凡例 : A = 1 OBS, B = 2 OBS, ...
    
       2 +             A
         |                                     A
         |                     A          A
         |                                                     A   A
    YGF2 |                                    A       A        A
         |                  A            A         A
         |              A                        A          A
         |                                        A
         |                         A  B         A AA
       0 +                            A                B     A         A
         |                                                A             A
         |                            A               A    A    A  A
         |                   A                          A     A
         |                                        A A                  A
         |                        A               B      A  A  AA
         |                                        A        A
         |                                         A
         |
      -2 +
         ---+------------+------------+------------+------------+------------+--
           -3           -2           -1            0            1            2
    
                                          IMGF3
    

    --- YG の第2因子(活動性)と筆跡の第3因子(筆跡の滑らかさ)との散布図 ---

      前節の結果から、両者の相関係数は -0.31657 である。さて、それではこれ以外の 対について、非線形な関係があるかどうか、残りのすべての因子間の散布図を検討 したが、このデータの場合、そのような関係は見られなかった。ここでは、そのような 中でも強いて非線形な関係を見るとすれば、みれなくもない YG の第1因子(情緒 安定性)と筆跡の第2因子(筆跡の力強さ)との間の散布図を示す:

              プロット : YGF1*IMGF2.  凡例 : A = 1 OBS, B = 2 OBS, ...
    
       2 +
         |           A                                   A              A
         |                                A           A
         |                          A   A   A  A         AA
         |                                   A      A        A
         |              A                 A          A     A  A    BA
       0 +                A  A        A A A      A      B             A
         |                                      A           A A
         |                                 A  A    A  A     A  A
    YGF1 |                            A A  A                A        A   A
         |                                   A
         |
      -2 +                          A                         A  A
         |
         |
         |
         |
         |
      -4 +
         ---+------------+------------+------------+------------+------------+--
           -3           -2           -1            0            1            2
    
                                          IMGF2
          

    --- YG の第1因子(情緒安定性)と筆跡の第2因子(筆跡の力強さ)と の散布図 ---

      上の散布図で強いて非線形な関係を見るとすれば、4次関数であろうか。もちろん これには、かなり無理がある。