この節には、つぎの5つの SAS プログラムのダウンロードコーナーを用意して あります:
| 1. 主因子法による因子分析・因子数推定プログラムの例 |
| 2. 最尤因子分析・因子数推定プログラムの例 |
| 3. 主因子法による因子分析・バリマックス回転プログラムの例 |
| 4. アルファ因子分析・因子数推定プログラムの例 |
| 5. アルファ因子分析プログラムの例 |
この節では、まず第2章の 2.7.2 節で既にその一部を紹介した Table 2.3 の筆跡
データに因子分析を施すための SAS プログラムの例と出力結果を述べる。このデー
タに対する因子分析の目的は、第2章で述べたのでここでは省略する。また、この
データの永久 SAS ファイル化プログラムについても、やはりそこで既に示している
ので、省略する。
つぎのプログラムは、Table 2.3 の筆跡データの因子分析のための SAS プログラム
を示す。第2章の 2.7.2 節では、重回帰分析の適用に先立つ筆跡データの因子分析
プログラムを既に示してあるが、そこではこのデータの因子数は既知であるものと
していた。しかし、一般的には当該現象を複数の尺度(変数)で測定する時、潜在
する因子の数や内容は未知の場合が多い。このような場合に、因子数を推定するため
の1つの情報が、つぎのプログラムにより得られる。
このプログラムは、因子数推定 のための3種類のプログラムから成る。もし、サンプル数が変数の数より少ないような 場合には、2番目のプログラムを実行するとエラーになるのでこれを外す必要がある。 サンプル数が変数数を下回ることは、モデル上からも望ましくないので、できる限り サンプル数を多めに取ることを勧める:
*-------------------------------------------------- November 22, 2018 |
| sas program--fact_pr1.sas-- |
| example 1 of sas programs for preliminary factor analysis. |
| |
| file name: $HOME/sasprog/multivar/fact_pr1.sas |
| |
*---------------------------------------------------------------------*;
libname sasfile "/folders/myfolders/permfile";
options pagesize=40;
title 'preliminary factor analysis-1';
proc factor data=sasfile.handout
simple nocorr mineigen=1.0 scree;
var img1-img29;
run;
title 'preliminary factor analysis-2';
proc factor data=sasfile.handout
nocorr priors=s mineigen=1.0 scree;
var img1-img29;
run;
title 'preliminary factor analysis-3';
proc factor data=sasfile.handout
nocorr priors=m mineigen=1.0 scree;
var img1-img29;
run;
|
| fact_pr1.sas |
上のプログラムの第1行の libname 文は、既に第2章で見たように、筆跡データ
を永久 SAS ファイル化したものが保存されているハードディスクのディレクトリパス
名を sasfile なる名で参照することを指示するものである。
一般に、主因子法で因子数を決定する場合、上の3つのプログラムをいつも使わ なければならないわけではない。もしサンプル数が変数数より大きい場合は、特別 の事情がない限り、2番目のプログラムでもエラーは起きないであろうから、最初の 2つで十分であろう。この場合、最も単純には2つ目のプログラムだけでもよかろう。 ここでは、上の3つのプログラムによる固有値の変化のプロット結果を検討する ことにより、最終的な因子数を推定することにする。 つぎに、それぞれの方法を簡単に説明する。どのプログラムも、第2章でのような オプションと異なり、因子数を推定するための特別なオプションが指定されている。
最初の factor プロシジャ (analysis-1) では、相関行列の対角要素をすべて
1にしての因子分析(実質的には主成分分析)を行い、固有値が1以上の因子の
数を推定因子数とする。この結果として得られた因子数は、最終的な縮退相関行列
の因子数の下限の1つを与えることがわかっている(Guttman, 1954; 芝, 1972)。
ここで、 mineigen= オプションが固有値1以上の因子の指定を指示
する。simple オプションは、因子分析すべき各変数の平均と標準偏差を
出力させるためのものである。最後の
scree オプションは計算された固有値を大きい順に平面上にプロットするための
ものである。
2番目の factor プロシジャ (analysis-2) では、相関行列の対角要素に、対応
する行変数を基準変数とし残りの変数を説明ないしは予測変数とする重回帰分析に
よる重相関係数の2乗(squared multiple corrrelation, SMC) を入れて因子分析
(ただしこの場合、主因子法)を行い、固有値が1以上の因子の数を求めている。
priors=s が、SMC による共通性の推定を指示する。
理論的には、この場合には固有値がゼロ以上の因子の数が最終的な縮退相関行列
の因子数のもう1つの下限を与えることがわかっているのであるが、これを実行
すると、因子数が大きくなりすぎる傾向がある。そこで、このプログラムでは、
mineigen=0 とせず、あえて 1.0 としたのである。
ただし、芝 (1972) にもあるように、Tucker, Koopman, Linn (1969) の研究か
らは共通性が全体的に大きいときには、相関行列の対角要素に SMC を充て
て固有値の変化を検討し、固有値
が急に落ちる手前までを(最終的な縮退相関行列)の因子数と見ると良いことが
わかっている。したがって、上の2番目の結果については、固有値1以上はあくま
でも1つの目安と考え、scree オプションにより出力される固有値のプロット結果
を見て、最終的な因子数の決定を行う必要がある。
3番目の factor プロシジャ (analysis-3) では、相関行列の対角要素に、相関
行列の非対角要素の絶対値最大のものの絶対値を入れて因子分析を行い、固有値が
1以上の因子の数を求めている。priors=m が、共通性の初期値を相関行列の非対
角要素の絶対値最大のものの絶対値とするためのものである。この方法による共通性
の初期推定は、サンプル数が少ない場合でも計算が可能という意味では、頑健でかつ
単純である。
上の3つのプログラムのうち、最初を除いては simple オプションを省略した
が、もし単独でどれか1つのプログラムを用いる場合は、これを省略しない方が
よかろう。
最後に、後者の2つのプログラムでは主因子法を指定していないにもかかわらず 主因子法による因子分析が行われることに注意したい。factor プロシジャでは、 各種の因子分析の方法を指定するために、method= オプションが用意されている のであるが、その default(省略の場合)が主因子法であるため、上のような指示 では主因子法による因子分析が行われることになるのである。ただし、既に述べた ように、第1番目のプログラムのように priors= オプションも指示しないか、もし くは priors=o (すべて1との指定)にすると、主成分分析(ただし相関行列に 関しての)を行うことに等しい。このようなわけで、上の3つのプログラムのそれ ぞれに method= オプション
| method=p |
3) 筆跡データの因子数推定プログラムの出力とその見方 前頁のプログラムを実行させると、つぎのような結果が得られる:
analysis-1 では相関行列の対角要素すなわち共通性を1と指示するので、 この項には初期因子法 (Initial Factor Method) として主成分分析 (principal components) との表示と、事前の共通性の推定値 (prior communality estimates) が1であるとの表示が出力されるのみとなる。
|
つぎに、共通性をすべて1とした相関行列の固有値とその比率等が出力される。
|
上の結果は、このようにして出力される筆跡データの相関行列の固有値とそ の比率である。これからわかるように、 SAS では n= オプション、mineigen= オプ ション、percent= オプション、などをどのように指定しようとも、すべての固有値 とそのパーセントなどを出力する。ここでは紙面の制約上、途中一部の固有値をカ ットした。また、出力の最後に当該抽出基準による推定因子数のうちの最小な因子 数を上のように文章で出力する。上のプログラムでは、mineigen=1.0 すなわち抽 出最小固有値の値は 1.0 までと指定したことを思い出そう。上の結果を見ると、 確かに1以上の固有値は6つであることがわかる。ただし、最後の因子数に関する 決定の結果は、あくまでも1つの参考資料と考えるべきである。
つぎに、上のプログラムでは全固有値の値の変化の様子を平面上にプロットする。 これは、既に述べたように scree オプションによる。
|
これは、縦軸に固有値の値を、横軸にすべての固有値の番号をとるものである。 既に述べたように、analysis-1 では相関行列の対角要素をすべて1にしているので、 推定される因子数は、1以上のものを考慮すると scree プロットを待つまでもなく、 上の固有値の値から6であるが、この図を見ると相対的には固有値は6番目から7番 目にかけては変化していないとみれる。
つぎに、共通性を1とした場合の相関行列の因子分析(この場合、実質的には 主成分分析)の回転前の因子パターン (factor pattern) が出力されるが、通常は これを用いた因子の解釈は行わないので、無視してよい。
最後に、抽出された6因子により説明される分散(これは、上で出力された 固有値の値に外ならない) (variance explained by each factor) と、各変数の 最終的な共通性 (final communality estimates) が出力される。ただし、これらの 結果も、因子数の推定が主目的であるこの分析では不要であるので、参考程度の ものと考えればよい。
|
つぎに、共通性に SMC を充てた場合の相関行列の固有値とその比率等が 出力される。
Eigenvalues of the Reduced Correlation Matrix:
Total = 25.2189866 Average = 0.86962023
1 2 3 4 5
Eigenvalue 11.6623 4.9030 2.1714 1.9420 1.2458
Difference 6.7593 2.7316 0.2294 0.6962 0.3351
Proportion 0.4624 0.1944 0.0861 0.0770 0.0494
Cumulative 0.4624 0.6569 0.7430 0.8200 0.8694
6 7 8 9 10
Eigenvalue 0.9107 0.6363 0.5344 0.4218 0.3461
Difference 0.2743 0.1019 0.1126 0.0757 0.1102
Proportion 0.0361 0.0252 0.0212 0.0167 0.0137
Cumulative 0.9055 0.9307 0.9519 0.9686 0.9824
.............................................
.............................................
26 27 28 29
Eigenvalue -0.0544 -0.0662 -0.0865 -0.1029
Difference 0.0118 0.0203 0.0164
Proportion -0.0022 -0.0026 -0.0034 -0.0041
Cumulative 1.0101 1.0075 1.0041 1.0000
5 factors will be retained by the MINEIGEN criterion.
|
上の結果は、このようにして出力される筆跡データの相関行列の固有値とその 比率である。これを見ると、共通性を1とした場合の前の結果と比較して固有値が 少し異なっていることがわかる。既に述べたように、この方法による推定因子数の 下限値はゼロ以上の固有値を持つものであるので、その基準からはこのデータの場合、 推定因子数は20となる。これは明らかに過大評価されている。もっとも、この プログラムでは mineigen=1.0 なる指定を行っているので、上の出力の最後には5 因子が推定されたと示されている。
つぎに出力されるのは、共通性に SMC を充てた場合の相関行列の全固有値の値 の変化の様子のプロット結果である。
Initial Factor Method: Principal Factors
Scree Plot of Eigenvalues
|
|
12.5 +
|
| 1
|
|
10.0 +
|
E |
i |
g |
e 7.5 +
n |
v |
a |
l |
u 5.0 + 2
e |
s |
|
|
2.5 +
| 3 4
|
| 5 6
| 78 9 0
0.0 + 1 23 4 5 6 78 9 0 1 23 4 5 6 78 9
|
-------+--------+--------+--------+--------+--------+--------+-------
0 5 10 15 20 25 30
Number
|
既に述べたように、Tucker らの研究 (1969) からは、共通性が全般に大きい時 には、SMC による全固有値の値の変化を検討し、固有値の値が急に落ちる手前までの 因子数を推定因子数とするとよい。上のプロット結果をこの点から検討すると、急に 落ちてからなだらかになるところは、第3、第4固有値で一ケ所、第5、第6固有値 で一ケ所、第7、8、9、10で一ケ所、第11固有値以降で一ケ所と、合計四ケ所 である。それらのうち、最後の二ケ所は固有値の値をみると小さすぎるので除外 するとして、最初の二ケ所を検討すると、第4固有値から第5固有値への落差の方が 第6固有値から第7固有値への落差より大きいので、上の結果からは4因子と見做す のが妥当であろう。
つぎに、共通性を SMC とした場合の相関行列の因子分析の回転前の因子パタ ーン (factor pattern) が出力されるが、通常はこれを用いた因子の解釈は行わ ないので、analysis-1 の場合と同様無視してよい。
最後に、抽出された5因子により説明される分散(これは、上で出力された 固有値の値に外ならない) (variance explained by each factor) と、各変数の 最終的な共通性 (final communality estimates) が出力される。ただし、これらの 結果も、因子数の推定が主目的であるこの分析では不要であるので、analysis-1 の 場合と同様無視してよい。
つぎの analysis-3 でも simple オプションを削ってあるので、平均と 標準偏差の情報は出力されず、まず相関行列の対角要素に推定された各行の相関 係数の絶対値最大なもの(正確にはその絶対値)による共通性の値が出力される。
Initial Factor Method: Principal Factors
Prior Communality Estimates: MAX
VAR1 VAR2 VAR3 VAR4 VAR5 VAR6
0.563018 0.812484 0.460549 0.894524 0.850926 0.698459
VAR7 VAR8 VAR9 VAR10 VAR11 VAR12
0.589461 0.779129 0.732491 0.849640 0.896191 0.841160
VAR13 VAR14 VAR15 VAR16 VAR17 VAR18
0.896191 0.800711 0.913137 0.717415 0.635399 0.639773
VAR19 VAR20 VAR21 VAR22 VAR23 VAR24
0.794700 0.944512 0.776683 0.779129 0.617485 0.773575
VAR25 VAR26 VAR27 VAR28 VAR29
0.820196 0.944512 0.812484 0.410692 0.332764
|
つぎに、共通性に各行の絶対値最大なものを充てた場合の相関行列の固有 値とその比率等が出力される。
Eigenvalues of the Reduced Correlation Matrix:
Total = 21.5773915 Average = 0.74404798
1 2 3 4 5
Eigenvalue 11.5626 4.7951 2.0485 1.7801 1.0720
Difference 6.7676 2.7466 0.2684 0.7080 0.3643
Proportion 0.5359 0.2222 0.0949 0.0825 0.0497
Cumulative 0.5359 0.7581 0.8530 0.9355 0.9852
6 7 8 9 10
Eigenvalue 0.7077 0.4884 0.3881 0.2535 0.2148
Difference 0.2193 0.1003 0.1346 0.0388 0.0962
Proportion 0.0328 0.0226 0.0180 0.0117 0.0100
Cumulative 1.0180 1.0406 1.0586 1.0704 1.0803
.............................................
.............................................
26 27 28 29
Eigenvalue -0.2044 -0.2238 -0.2593 -0.3002
Difference 0.0194 0.0355 0.0409
Proportion -0.0095 -0.0104 -0.0120 -0.0139
Cumulative 1.0363 1.0259 1.0139 1.0000
5 factors will be retained by the MINEIGEN criterion.
|
上の結果からは、1以上の固有値なる基準より5因子が推定される。
つぎに出力されるのは、共通性に相関行列の行(または列)の絶対値最大 なものを充てた場合の相関行列の全固有値の値の変化の様子のプロット結果である。
Initial Factor Method: Principal Factors
Scree Plot of Eigenvalues
|
|
12.5 +
| 1
|
|
10.0 +
|
|
E |
i 7.5 +
g |
e |
n |
v 5.0 + 2
a |
l |
u |
e 2.5 +
s | 3 4
| 5
| 6 78
0.0 + 9 0 1 23 4 5 6 78 9 0 1 23 4 5 6 78 9
|
|
|
-2.5 +
|
|
-------+--------+--------+--------+--------+--------+--------+-------
0 5 10 15 20 25 30
Number
|
上の結果からは、4因子か5因子か決めかねる。
これまでの出力結果を総合すると、筆跡データの因子数は4因子から6因子までの
いずれかと推定される。analysis-2 の結果からは、4因子が妥当であろう。ただし、
最終的な推定因子数は、因子の心理学的有意味性や統計学的有意性なども考慮して
最終的に決定するのが望ましいであろうから、この時点では因子数は4因子から6因子
の範囲と見做し、それぞれの因子数を指定した因子分析を再度行い、因子軸の回転を
試み、最終的な判断を慎重に行うのがよかろう。
つぎに示すように、これを行う前にさらに最尤因子分析法を用いて統計学的な角 度からも因子数を検討することも1案であるが、どうしても行わなければいけない というわけではなかろう。
つぎのプログラムでは、筆跡データの最尤因子分析法による因子数推定のための
プログラムを示す。SAS の最尤因子分析法では、以下に示すように1つの factor
プロシジャのみで因子数の検定を行うことはできず、因子数を n= オプションで
1回ごとに指定し、ゼロ因子及び当該因子数に関する帰無仮説を検定しなければ
ならない。
もっとも、だからといって1因子から考えられる最大の因子数までをすべて検定
する必要はないであろう。例えばこのデータの場合、主因子法で因子数は4因子から
6因子の範囲だということが推定されている場合は、4因子から始めて7因子ぐらい
までの範囲で最尤因子分析を行ってやれば十分であろう。なぜならば、一般にユーザが
因子分析を行う場合、サンプル数は変数数に対して十分なだけでなく、100とか
200のサイズになることが多いであろう。このような場合、一般に最尤因子分析法
では、例えば芝 (1972, p.186) によれば、サンプル数が多くなると検出力が増し、
与えられた相関行列を説明するのに必要な因子数が多くなるという。
ただし、もし主因子法で推定した因子数の下限値(このデータでは、4)で
検定して帰無仮説(4因子で十分)が採択されてしまった場合は、逆に3、2、と
因子数を少なくして再度最尤因子分析法を実行させなければならない。
いずれにせよ、注意すべきは最尤因子分析法における帰無仮説は、当該因子で (相関行列を)十分説明できる、というものであるので、因子数の検定は、より少ない 因子数から始めて行き、初めて帰無仮説が採択されたところで終了させなければ いけない点である(初めて棄却されたところではない!)。
*--------------------------------------------------- October 22, 1998 |
| sas program--fact_ml.sas-- |
| A sas program for maximum likelihodd factor analysis. |
| |
| file name: $HOME/sasprog/multivar/fact_ml.sas |
| |
*---------------------------------------------------------------------*;
options pagesize=60;
libname sasfile '$HOME/sasset/others';
title 'ML-FA for Fujii data with four factors';
proc factor data=sasfile.handout
nocorr method=ml priors=m hey n=4;
var var1-var29;
run;
title 'ML-FA for Fujii data with five factors';
proc factor data=sasfile.handout
nocorr method=ml priors=m hey n=5;
var var1-var29;
run;
title 'ML-FA for Fujii data with six factors';
proc factor data=sasfile.handout
nocorr method=ml priors=m hey n=6;
var var1-var29;
run;
title 'ML-FA for Fujii data with seven factors';
proc factor data=sasfile.handout
nocorr method=ml priors=m hey n=7;
var var1-var29;
run;
|
| fact_ml.sas |
上のプログラムの最初の factor プロシジャは、4因子指定で筆跡データの最尤
因子分析を行うためのものである。method=ml は、最尤因子分析法を指示している。
もちろん、n=4 が4因子を指示している。
つぎの priors=m は、主因子法のプログラムのところで既に説明したように、共通性
の初期推定値として相関行列の行(又は列)の絶対値最大なものの絶対値を充てる
ことを指示している。最尤因子分析法の場合でも、もちろんいろいろな共通性の
推定が可能であるが、最尤因子分析法自身がかなり cpu 時間を消費するので、ここでは
共通性として SMC を用いず cpu の負荷を少なくするために、うえの絶対値の方法を
指定した。
このプロシジャのもう1つのオプションである hey は、最尤因子分析法特有の
問題を回避する1つの手立てに関するものである。テキスト 3.3.3 節で紹介した
ように、最尤因子分析法では共通性が1を越えてしまうケースがありうる。このような
いわゆるヘイウッド ケース (Heywood case) が反復解法の途上で生じた場合にそれら
を強制的に1とするのが、この指示である。
残りの3つの factor プロシジャについては、説明を要しないであろう。
5) 筆跡データの最尤因子分析法・因子数推定プログラムの出力結果の見方
上述の最尤因子分析法・因子数推定プログラムを実行すると、つぎのような結果が 得られる。つぎの結果は最初の4因子指定の結果に関するものであるが、同様な結果が 各指定因子ごとに出力されるので、それらについては省略する:
Initial Factor Method: Maximum Likelihood
Significance tests based on 50 observations:
Test of H0: No common factors.
vs HA: At least one common factor.
Chi-square = 1640.500 df = 406 Prob>chi**2 = 0.0001
Test of H0: 4 Factors are sufficient.
vs HA: More factors are needed.
Chi-square = 429.406 df = 296 Prob>chi**2 = 0.0001
Chi-square without Bartlett's correction = 587.18756873
Akaike's Information Criterion = -4.812431267
Schwarz's Bayesian Criterion = -570.7712409
Tucker and Lewis's Reliability Coefficient = 0.8517760711
|
上の結果から、2つの検定結果が読み取れる。まず、第1の検定はゼロ因子の検定
であり、帰無仮説(共通因子はない)のもとで標本から計算された $\chi^2$-値以上
の確率 Prob$>$chi**2 = 0.0001 から、少なくとも1因子は存在することがわかる。
SAS では、指定因子数がゼロでない場合でも常にこの帰無仮説も同時に検定し出力
することに注意したい。
第2の検定は、4因子で説明できる(十分である)というもので、出力結果からは
同様にしてこの仮説も棄却されていることがわかる。すなわち、このデータの共通因子
は4因子より大であることになる。
上の結果を見ると、SAS の最尤因子分析では、検定の後に幾つかの指標も出力される ことがわかる。これらのうち、AIC などは検定を離れて全く別の視点からモデルを 選択するための有効な方法であり、重回帰分析と同様、AIC の最小なモデルを選択 することになる。これについては後で7因子までの値を比較することにしよう。
検定結果の出力に引き続き、各種情報から因子パターン、各因子により説明 される因子の分散や最終的な共通性の推定値までの情報が出力されるが、因子数の 検定のためには不要なので無視すればよい。
出力は、5因子指定から7因子指定時まで、各因子について上の項目1から
5までが繰り返される。したがって、ユーザは各々の検定結果の個所のみを見ていき、
当該因子数に関する帰無仮説が初めて採択される時の因子数を、最終因子数とすれば
よい。
最後に、各因子での検定結果のうち、P-値と AIC のみをまとめるとつぎのように なる(出力結果ではない!):
指定因子数
4 5 6 7
Prob 0.0001 0.0030 0.0279 0.1398
AIC -4.81 -69.09 -80.37 -90.33
|
この結果からは、危険率をもし1%水準に取るならば、4因子および5因子では
帰無仮説は棄却されるが、6因子目で採択されることになる。サンプル数が多い
場合は、有意水準は高めに(値は低めに)見積もった方がよいだろう。ここで
は1%水準に設定することにすれば、筆跡データの因子数は6因子ということになる。
ただし、AIC の値からは第7因子めが最小になっており、もうすこし大きな因子
数になる可能性もある。
AIC による判断は行わないとすると、この結果(6因子)は主因子法による推定 因子数4から6の上限値になっている。主因子法の結果も考慮するとすれば、筆跡 データの因子数はこれらの真ん中を取り5とするのが1案である。
つぎのプログラムは、因子数推定後の主因子法プログラムである。これまでの 結果から、筆跡データの因子数を一応5と推定したが、念のためここでは4因子解 と5因子解の両方を求め、解釈可能性を探ることにする。このデータの5因子解は 既に 2.7.2 節で共通性の初期推定を相関行列の行(又は列)の絶対値最大値を充てた 場合については紹介しているので、ここでは共通性に SMC を充てる方法により 求めることにする。
*-------------------------------------------------- November 29, 2018 |
| sas program--fact_var.sas-- |
| example 2 of sas programs for preliminary factor analysis. |
| |
| file name: $HOME/sasprog/multivar/fact_var.sas |
| |
*---------------------------------------------------------------------*;
*/ libname sasfile '$HOME/sasset/others'; */
libname sasfile "/folders/myfolders/permfile";
options pagesize=60;
title 'principal FA for the Fujii data/ 4-factor solution ';
proc factor data=sasfile.Fujiiraw
nocorr priors=s n=4 r=v re;
var img1-img29;
run;
title 'principal FA for the Fujii data/ 5-factor solution ';
proc factor data=sasfile.Fujiiraw
nocorr priors=s n=5 r=v re;
var img1-img29;
run;
|
| fact_var.sas |
factor プロシジャのオプションのうち、2.7.2 節では rotate=v と書いた因子軸
の回転のオプションは、ここでは略記して r=v と書いている。re(reorder の略)
オプションは、第1因子から順に因子負荷量の絶対値の大きい変数を選び出し、
変数をそれらの順に並べ換えて、どの変数がどの因子に関係が深いかを見やすくし、
因子の命名を容易にするためのものである。
上のプログラムを実行すると、つぎのような結果が出力される:
因子分析では、多くの場合得られた因子パターン(因子負荷行列)を心理学的 により有意味なものにする目的で、座標回転する。この項で出力される因子パターン は、そのような回転の前の段階のものであるので、因子の解釈には用いないことが 多い。したがって、この出力結果は無視することにする。この出力結果の最後には、 回転前の各因子により説明される因子の分散も出力されるが、これについても無視 する。
つぎに、4次元解における最終的な共通性の推定値が出力される。これらの 値は、最終的な回転後の因子パターンの右端に各変数ごと表示する必要がある。
Initial Factor Method: Principal Factors
Final Communality Estimates: Total = 20.678785
IMG1 IMG2 IMG3 IMG4 IMG5 IMG6
0.549222 0.543109 0.158018 0.896753 0.900323 0.792421
IMG7 IMG8 IMG9 IMG10 IMG11 IMG12
0.442962 0.863275 0.826796 0.797558 0.896942 0.868000
IMG13 IMG14 IMG15 IMG16 IMG17 IMG18
0.856226 0.849094 0.900408 0.905550 0.682480 0.503250
IMG19 IMG20 IMG21 IMG22 IMG23 IMG24
0.754220 0.920047 0.807663 0.775411 0.534813 0.657869
IMG25 IMG26 IMG27 IMG28 IMG29
0.846321 0.902066 0.780268 0.268495 0.199225
|
つぎに、因子軸のバリマックス回転のための直交変換行列 (orthogonal transformation matrix) が出力されるが、通常はこれは必要ないので無視してよい。
つぎに出力されるのが、回転後の因子パターンであり、これを見て各因子の 解釈と命名を行うことになる。最後に最終的な各因子の因子寄与が出力される。 これらの値も、最終的な因子パターンの各行の最後に因子寄与として追加する必要 がある。
Rotated Factor Pattern
FACTOR1 FACTOR2
IMG20 0.92920 0.06529
IMG26 0.92761 0.03918
IMG5 0.92273 -0.18526
IMG15 0.90422 -0.04391
IMG4 0.88014 -0.21349
IMG14 0.82866 0.27861
IMG19 0.81419 0.04687
IMG25 0.81063 -0.32744
IMG24 0.77879 -0.04850
IMG12 0.77676 0.06974
IMG2 0.69129 0.14035
IMG18 0.69125 0.09464
|
IMG16 0.63763 0.63056
IMG7 0.63648 0.17600
IMG23 -0.63607 -0.13385
IMG27 -0.79376 -0.24234
IMG11 0.08096 0.90883
IMG13 -0.00235 0.88007
IMG10 -0.05602 0.84706
IMG6 0.27836 0.83207
IMG28 -0.11027 0.47981
IMG29 0.20962 0.24204 sd-scale for the image of holographs
IMG22 -0.06055 0.08113
IMG8 -0.28002 0.30696
IMG21 0.42961 -0.05217
IMG9 0.42515 0.11610
IMG1 0.08152 0.05801
IMG17 0.12722 0.45997
IMG3 -0.01101 -0.01506
FACTOR3 FACTOR4
IMG20 -0.15823 0.16531
IMG26 -0.20005 -0.00730
IMG5 0.12072 -0.00142
IMG15 -0.15555 0.23806
IMG4 -0.24478 0.12890
IMG14 0.23772 0.16819
IMG19 0.28144 0.09954
IMG25 -0.28616 -0.00986
IMG24 -0.19954 -0.09581
IMG12 0.03993 0.50812
IMG2 -0.20428 -0.06162
IMG18 -0.12109 0.04257
IMG16 -0.12334 0.29354
IMG7 0.03785 0.07383
IMG23 0.24146 -0.23241
IMG27 0.29006 0.08572
IMG11 0.17641 0.18246
IMG13 0.27311 0.08427
IMG10 0.25145 -0.11701
IMG6 -0.09553 -0.11605
IMG28 -0.04611 0.15490
IMG29 0.21925 -0.22053 sd-scale for the image of holographs
IMG22 0.85987 0.16058
IMG8 0.82929 0.05404
IMG21 -0.75942 0.20894
IMG9 -0.13075 0.78452
IMG1 0.07177 0.73079
IMG17 -0.25824 0.62292
IMG3 0.08429 0.38803
Variance explained by each factor
FACTOR1 FACTOR2 FACTOR3 FACTOR4
10.799777 4.447072 2.966353 2.465583
|
主因子法による主因子解は、直交因子解の1つであるので、テキスト (3.7) 式より
$\mbphi$ が単位行列になる。したがって、もとの変数と共通因子との相関 $\mbP$ は
$\mbA$ すなわち因子パターン(因子負荷行列)そのものとなる。言い換えれば、直交
解では因子パターンの各要素(因子負荷量)が、もとの変数と各共通因子との相関
係数になっているので、各因子の解釈と命名を行うためには、各因子ごと相関係数
の絶対値の高いもののみをピックアップし、それらの変数に共通するものとして適切
な因子名を与えればよい。既に述べたように、そのためには re (reorder) オプション
を factor プロシジャのオプション欄に指定してやればよい。これにより、変数が
上のように並べ換えられて出力されるので、大変便利である。
このことを利用して筆跡の4因子を解釈し命名すると、つぎのようになる:まず、
第1因子に負荷の高い項目を因子負荷量の絶対値の大きい順に幾つかあげると、項目
20(よいー悪い)、26(読みやすいー読みにくい)、5(ていねいなー雑な)、
15(字形が整っているー字形が整っていない)、等となる。そこで、ここではこの
因子を「筆跡の評価因子」と名づけることにする。
同様に、第2因子については、それらは項目11(強いー弱い)、13(重いー
軽い)、10(線が太いー線が細い)、6(大きいー小さい)である。そこで、第2
因子は、「筆跡の力強さの因子」と名づけることにする。
第3因子は、項目22(角ばったー丸っこい)、8(硬いーやわらかい)に高い
負荷量を示している。また、項目21(なめらかなーこつこつした)に負の高い負
荷量を示している。このような負荷量の正負は、項目の意味内容が反対であるた
めに起こる。例えばこの場合、項目21が負の負荷量であるので、意味内容
を「なめらかなーこつこつした」から、「こつこつしたーなめらかな」に変えてやる
と、他の2項目との意味内容(の方向)が一致することがわかる。
このような場合、データをコード化する時点でこのような反転項目については
最初から評定尺度のコード値を反転しておくことも可能であるが、そのような作業は
面倒であり必要ない。いずれにせよ、上の結果から第3因子は、「筆跡の滑らかさ
の因子」と名づける。
第4因子は、項目9(鋭いー鈍い)、1(右上がりー右下がり)、17(抑揚が
あるー抑揚がない)、12(しまりがあるーしまりがない)に高い負荷を示しており、
「筆跡のアクセント因子」と名づけることにする。
最後に、同一データに対して行った第2章での因子分析結果での因子パターンと ここでの SMC を共通性の初期推定値として充てた結果とを比較してみよう。ここでは、 4因子を指定していること、さらに第2章での因子分析結果は共通性に相関行列の 行(又は列)の絶対値最大値を充てているという点が異なるにもかかわらず、両方の 因子パターンは細部にわたりきわめて似通っていることがわかる。
これまでにその例を議論してきた主因子法による主因子解は、数ある因子分析の
解法の中で最もよく使われ、よく知られた方法である。しかし、場合によってはつぎ
に簡単にその使い方を紹介するアルファ因子分析は、テキスト 3.2.2 節で述べた
ように、因子の信頼性を最大にするようにして求めるもので、因子の信頼性にウエイト
を置いた分析を行おうとする時、有用なものであろう。
この方法に対して、研究者の中には、主因子法で因子解を求めておき、得られた
因子パターンから因子負荷の高い項目のみをピックアップし、それらによる信頼性
係数を求めるという2段階の分析を行う者もいるが、それならば最初からアルファ
因子分析を行った方がはるかに合理的であり、余分な手間も取らないであろう。
つぎのプログラムは、筆跡データのアルファ因子分析に先立ち、因子数を推定する ためのものである。method=a が、アルファ因子分析を指定するものである。この 方法の場合、固有値が1以上の因子の数で因子数を推定する。SAS では、アルファ 因子分析の場合、共通性の default は SMC となっている:
*-------------------------------------------------- October 23, 1998 -*
| sas program--fact_pr2.sas-- |
| example 2 of sas programs for preliminary factor analysis. |
| |
| file name: $HOME/sasprog/multivar/fact_pr2.sas |
| |
*---------------------------------------------------------------------*;
libname sasfile '$HOME/sasset/others';
options pagesize=40;
title 'alpha FA for the Fujii data';
proc factor data=sasfile.Fujiiraw
nocorr method=a mineigen=1.0 scree;
var img1-img29;
run;
|
| fact_pr2.sas |
9) 筆跡データのアルファ因子分析法・因子数推定プログラムの出力結果の見方
前頁のプログラムを実行させると、つぎのような結果が得られる:
ここでの出力結果は、主因子法で SMC を用いた既述の analysis-2 における と同一の結果であるので、省略する。
つぎに、共通性に SMC を充てたアルファ因子分析の固有値とその比率等が出力 される。共通性は SMC と、同一であるが、テキスト 3.2.1 節でまとめたように固有値 問題は主因子法と若干異なるので、ここで出力される固有値の値も SMC の場合と 比べて異なる。
Preliminary Eigenvalues: Total = 29 Average = 1
1 2 3 4 5
Eigenvalue 12.9236 5.4742 2.5862 2.2967 1.5205
Difference 7.4493 2.8880 0.2895 0.7761 0.3046
Proportion 0.4456 0.1888 0.0892 0.0792 0.0524
Cumulative 0.4456 0.6344 0.7236 0.8028 0.8552
6 7 8 9 10
Eigenvalue 1.2159 0.8407 0.6570 0.5588 0.4334
Difference 0.3752 0.1837 0.0982 0.1253 0.1612
Proportion 0.0419 0.0290 0.0227 0.0193 0.0149
Cumulative 0.8971 0.9261 0.9488 0.9681 0.9830
.........................................
.........................................
26 27 28 29
Eigenvalue -0.0617 -0.0782 -0.1017 -0.1289
Difference 0.0165 0.0235 0.0272
Proportion -0.0021 -0.0027 -0.0035 -0.0044
Cumulative 1.0106 1.0079 1.0044 1.0000
6 factors will be retained by the MINEIGEN criterion.
|
固有値1以上の基準から、6因子が推定されることがわかる。
つぎに出力されるのは、共通性に SMC を充てた場合のアルファ因子分析による 相関行列の全固有値の値の変化の様子のプロット結果である。
Initial Factor Method: Alpha Factor Analysis
Scree Plot of Eigenvalues
|
|
|
|
15 +
|
|
| 1
|
E |
i |
g 10 +
e |
n |
v |
a |
l |
u | 2
e 5 +
s |
|
| 3
| 4
| 5 6
| 78 9 0
0 + 1 23 4 5 6 78 9 0 1 23 4 5 6 78 9
|
|
|
--------+--------+--------+--------+--------+--------+--------+--------
0 5 10 15 20 25 30
Number
|
アルファ因子分析による因子数の推定を固有値1以上と考えると、このような 全固有値の値の変化の様子のプロットの必要はないが、参考のため出力した。
つぎのプログラムは、因子数推定後のアルファ因子分析プログラムである。アルファ 因子分析解も主因子解と同様、回転可能であるが、回転により信頼性の値も変るの で、ここでは回転は行わないことにした。SAS では回転法(r= オプション)の default は、回転なしであるので、以下のプログラムでそれを指定したことになる。
*-------------------------------------------------- October 23, 1998 -*
| sas program--fact_alp.sas-- |
| example 2 of sas programs for alpha-factor analysis. |
| |
| file name: $HOME/sasprog/multivar/fact_alp.sas |
| |
*---------------------------------------------------------------------*;
libname sasfile '$HOME/sasset/others';
options pagesize=60;
title 'alpha FA for the Fujii data/ 6-factor solution';
proc factor data=sasfile.Fujiiraw
nocorr method=a n=6 re;
var img1-img29;
run;
|
| fact_alp.sas |
11) 筆跡データのアルファ因子分析プログラムの出力結果の見方
上のプログラムを実行すると、つぎのような結果が出力される:
つぎに、反復近似による共通性の推定値を用いた重み付き縮退相関行列 (the weighted reduced correlation matrix) の固有値とその比率等が出力される。
つぎに、各因子のアルファ係数が出力される。
Coefficient Alpha for each factor
FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 FACTOR6
0.964233 0.865230 0.690670 0.617309 0.413181 0.235603
|
この結果を見ると、推定された6因子のうち4因子まではかなり信頼性が 高いことがわかる。
つぎに、回転前のアルファ因子分析による因子パターンが出力される。
Initial Factor Method: Alpha Factor Analysis
Factor Pattern
FACTOR1 FACTOR2
IMG20 0.95018 -0.05903
IMG15 0.92911 -0.14454
IMG26 0.91710 -0.12981
IMG4 0.87658 -0.34104
IMG12 0.83560 0.10402
IMG5 0.83462 -0.18346
IMG14 0.81009 0.30153
IMG16 0.77470 0.50138
IMG25 0.77396 -0.49323
IMG19 0.74944 0.11220
IMG24 0.74232 -0.21330
IMG18 0.70581 -0.00095
IMG2 0.70049 -0.01615
IMG7 0.63126 0.11502
IMG9 0.58854 0.13364
IMG21 0.57631 -0.36506
IMG23 -0.72432 0.01256
IMG27 -0.83181 -0.01910
IMG13 0.08964 0.91651
IMG11 0.20934 0.89832
IMG10 0.00102 0.81020
IMG6 0.37872 0.65163
IMG8 -0.36246 0.64495
IMG28 -0.00947 0.42843
IMG17 0.33815 0.38620
IMG29 0.15333 0.23539 sd-scale for the image of holographs
IMG22 -0.17164 0.48404
IMG1 0.21766 0.20667
IMG3 0.04703 0.09020
FACTOR3 FACTOR4
IMG20 -0.02184 0.01979
IMG15 0.03279 0.09365
IMG26 -0.12266 -0.09179
IMG4 -0.01805 0.06350
IMG12 0.13386 0.30779
IMG5 -0.33300 0.22240
IMG14 -0.16824 0.18620
IMG16 0.19735 -0.14902
IMG25 -0.08410 -0.02229
IMG19 -0.26450 0.31177
IMG24 -0.11861 -0.07310
|
IMG18 -0.11257 -0.05344
IMG2 -0.07482 -0.09856
IMG7 -0.12284 0.02983
IMG9 0.55455 0.32050
IMG21 0.48360 -0.28535
IMG23 -0.06625 0.05103
IMG27 0.08596 0.24889
IMG13 -0.05145 -0.17768
IMG11 0.10106 -0.18294
IMG10 -0.12156 -0.26052
IMG6 0.02963 -0.41136
IMG8 -0.30067 0.43487
IMG28 0.30169 -0.13116
IMG17 0.58229 -0.05325
IMG29 -0.31045 -0.05567 sd-scale for the image of holographs
IMG22 -0.33537 0.63495
IMG1 0.48271 0.51184
IMG3 0.28611 0.35457
|
主因子法の場合と同様、アルファ因子分析の6因子解を上の因子パターンをもとに
解釈すると、最初の2因子は主因子法による4因子解のそれらとほぼ一致し、それぞれ
「筆跡の評価因子」と「筆跡の力強さの因子」とみれる。第3因子も主因子法による
4因子解の第4因子に似ているが、よくみると少し異なる。第4因子に負荷の高い
項目22、及び1からは、この因子の解釈は難しい。第5、6因子になると、さらに
解釈が難しくなる。
それでは、少なくともこのデータの場合、アルファ因子分析による6因子のうち 第3因子以降は意味のないものなのであろうか。この点については、ここですぐに そのような結論を出すことは避けるべきであろう。なぜならば、主因子法による主 因子解のバリマックス回転結果は、あくまでも因子の心理学的解釈可能性を高める ことを目指した1つの結果であるのに対して、アルファ因子分析による結果はそれ とは異なる因子の信頼性を高めることを目指した1つの結果であり、2つの方法の 目標が原理的に異なるからである。どちらが、より適切なものであるかは例えば因子の 妥当性(予測的妥当性や内容的妥当性など)の基準に照らして別の角度から結論を 下す必要があろう。
Factor Pattern
FACTOR5 FACTOR6
IMG20 -0.04617 0.11444
IMG15 -0.14161 0.20103
IMG26 0.01771 0.13388
IMG4 -0.00883 0.06413
IMG12 -0.24291 0.06730
IMG5 0.01198 0.12782
IMG14 -0.01963 0.15523
IMG16 -0.04055 0.08855
IMG25 -0.13834 0.14300
IMG19 0.13900 0.16170
IMG24 0.08271 0.04646
IMG18 -0.03895 -0.13648
IMG2 0.45229 -0.14819
IMG7 -0.07480 -0.02911
IMG9 -0.25602 0.00553
IMG21 0.17985 -0.05125
IMG23 0.25058 0.46864
IMG27 -0.28794 0.11881
IMG13 -0.15729 -0.11866
IMG11 -0.13897 0.01268
IMG10 -0.04974 0.01144
IMG6 0.38305 0.02601
IMG8 -0.02760 0.06045
IMG28 0.19400 0.37552
IMG17 -0.27953 -0.00897
IMG29 0.01373 -0.19962 sd-scale for the image of holographs
IMG22 0.06311 0.12187
IMG1 0.09981 -0.37929
IMG3 0.47363 -0.09603
Variance explained by each factor
FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 FACTOR6
Weighted 14.489276 6.075115 3.001687 2.475385 1.663710 1.294463
Unweighted 11.564554 4.828050 1.963329 1.893119 1.132575 0.822514
|