この節には、つぎの5つの SAS プログラムのダウンロードコーナーを用意して あります:
1. 主因子法による因子分析・因子数推定プログラムの例 |
2. 最尤因子分析・因子数推定プログラムの例 |
3. 主因子法による因子分析・バリマックス回転プログラムの例 |
4. アルファ因子分析・因子数推定プログラムの例 |
5. アルファ因子分析プログラムの例 |
この節では、まず第2章の 2.7.2 節で既にその一部を紹介した Table 2.3 の筆跡
データに因子分析を施すための SAS プログラムの例と出力結果を述べる。このデー
タに対する因子分析の目的は、第2章で述べたのでここでは省略する。また、この
データの永久 SAS ファイル化プログラムについても、やはりそこで既に示している
ので、省略する。
つぎのプログラムは、Table 2.3 の筆跡データの因子分析のための SAS プログラム
を示す。第2章の 2.7.2 節では、重回帰分析の適用に先立つ筆跡データの因子分析
プログラムを既に示してあるが、そこではこのデータの因子数は既知であるものと
していた。しかし、一般的には当該現象を複数の尺度(変数)で測定する時、潜在
する因子の数や内容は未知の場合が多い。このような場合に、因子数を推定するため
の1つの情報が、つぎのプログラムにより得られる。
このプログラムは、因子数推定 のための3種類のプログラムから成る。もし、サンプル数が変数の数より少ないような 場合には、2番目のプログラムを実行するとエラーになるのでこれを外す必要がある。 サンプル数が変数数を下回ることは、モデル上からも望ましくないので、できる限り サンプル数を多めに取ることを勧める:
*-------------------------------------------------- November 22, 2018 | | sas program--fact_pr1.sas-- | | example 1 of sas programs for preliminary factor analysis. | | | | file name: $HOME/sasprog/multivar/fact_pr1.sas | | | *---------------------------------------------------------------------*; libname sasfile "/folders/myfolders/permfile"; options pagesize=40; title 'preliminary factor analysis-1'; proc factor data=sasfile.handout simple nocorr mineigen=1.0 scree; var img1-img29; run; title 'preliminary factor analysis-2'; proc factor data=sasfile.handout nocorr priors=s mineigen=1.0 scree; var img1-img29; run; title 'preliminary factor analysis-3'; proc factor data=sasfile.handout nocorr priors=m mineigen=1.0 scree; var img1-img29; run; |
fact_pr1.sas |
上のプログラムの第1行の libname 文は、既に第2章で見たように、筆跡データ
を永久 SAS ファイル化したものが保存されているハードディスクのディレクトリパス
名を sasfile なる名で参照することを指示するものである。
一般に、主因子法で因子数を決定する場合、上の3つのプログラムをいつも使わ なければならないわけではない。もしサンプル数が変数数より大きい場合は、特別 の事情がない限り、2番目のプログラムでもエラーは起きないであろうから、最初の 2つで十分であろう。この場合、最も単純には2つ目のプログラムだけでもよかろう。 ここでは、上の3つのプログラムによる固有値の変化のプロット結果を検討する ことにより、最終的な因子数を推定することにする。 つぎに、それぞれの方法を簡単に説明する。どのプログラムも、第2章でのような オプションと異なり、因子数を推定するための特別なオプションが指定されている。
最初の factor プロシジャ (analysis-1) では、相関行列の対角要素をすべて
1にしての因子分析(実質的には主成分分析)を行い、固有値が1以上の因子の
数を推定因子数とする。この結果として得られた因子数は、最終的な縮退相関行列
の因子数の下限の1つを与えることがわかっている(Guttman, 1954; 芝, 1972)。
ここで、 mineigen= オプションが固有値1以上の因子の指定を指示
する。simple オプションは、因子分析すべき各変数の平均と標準偏差を
出力させるためのものである。最後の
scree オプションは計算された固有値を大きい順に平面上にプロットするための
ものである。
2番目の factor プロシジャ (analysis-2) では、相関行列の対角要素に、対応
する行変数を基準変数とし残りの変数を説明ないしは予測変数とする重回帰分析に
よる重相関係数の2乗(squared multiple corrrelation, SMC) を入れて因子分析
(ただしこの場合、主因子法)を行い、固有値が1以上の因子の数を求めている。
priors=s が、SMC による共通性の推定を指示する。
理論的には、この場合には固有値がゼロ以上の因子の数が最終的な縮退相関行列
の因子数のもう1つの下限を与えることがわかっているのであるが、これを実行
すると、因子数が大きくなりすぎる傾向がある。そこで、このプログラムでは、
mineigen=0 とせず、あえて 1.0 としたのである。
ただし、芝 (1972) にもあるように、Tucker, Koopman, Linn (1969) の研究か
らは共通性が全体的に大きいときには、相関行列の対角要素に SMC を充て
て固有値の変化を検討し、固有値
が急に落ちる手前までを(最終的な縮退相関行列)の因子数と見ると良いことが
わかっている。したがって、上の2番目の結果については、固有値1以上はあくま
でも1つの目安と考え、scree オプションにより出力される固有値のプロット結果
を見て、最終的な因子数の決定を行う必要がある。
3番目の factor プロシジャ (analysis-3) では、相関行列の対角要素に、相関
行列の非対角要素の絶対値最大のものの絶対値を入れて因子分析を行い、固有値が
1以上の因子の数を求めている。priors=m が、共通性の初期値を相関行列の非対
角要素の絶対値最大のものの絶対値とするためのものである。この方法による共通性
の初期推定は、サンプル数が少ない場合でも計算が可能という意味では、頑健でかつ
単純である。
上の3つのプログラムのうち、最初を除いては simple オプションを省略した
が、もし単独でどれか1つのプログラムを用いる場合は、これを省略しない方が
よかろう。
最後に、後者の2つのプログラムでは主因子法を指定していないにもかかわらず 主因子法による因子分析が行われることに注意したい。factor プロシジャでは、 各種の因子分析の方法を指定するために、method= オプションが用意されている のであるが、その default(省略の場合)が主因子法であるため、上のような指示 では主因子法による因子分析が行われることになるのである。ただし、既に述べた ように、第1番目のプログラムのように priors= オプションも指示しないか、もし くは priors=o (すべて1との指定)にすると、主成分分析(ただし相関行列に 関しての)を行うことに等しい。このようなわけで、上の3つのプログラムのそれ ぞれに method= オプション
method=p |
3) 筆跡データの因子数推定プログラムの出力とその見方 前頁のプログラムを実行させると、つぎのような結果が得られる:
analysis-1 では相関行列の対角要素すなわち共通性を1と指示するので、 この項には初期因子法 (Initial Factor Method) として主成分分析 (principal components) との表示と、事前の共通性の推定値 (prior communality estimates) が1であるとの表示が出力されるのみとなる。
|
つぎに、共通性をすべて1とした相関行列の固有値とその比率等が出力される。
|
上の結果は、このようにして出力される筆跡データの相関行列の固有値とそ の比率である。これからわかるように、 SAS では n= オプション、mineigen= オプ ション、percent= オプション、などをどのように指定しようとも、すべての固有値 とそのパーセントなどを出力する。ここでは紙面の制約上、途中一部の固有値をカ ットした。また、出力の最後に当該抽出基準による推定因子数のうちの最小な因子 数を上のように文章で出力する。上のプログラムでは、mineigen=1.0 すなわち抽 出最小固有値の値は 1.0 までと指定したことを思い出そう。上の結果を見ると、 確かに1以上の固有値は6つであることがわかる。ただし、最後の因子数に関する 決定の結果は、あくまでも1つの参考資料と考えるべきである。
つぎに、上のプログラムでは全固有値の値の変化の様子を平面上にプロットする。 これは、既に述べたように scree オプションによる。
|
これは、縦軸に固有値の値を、横軸にすべての固有値の番号をとるものである。 既に述べたように、analysis-1 では相関行列の対角要素をすべて1にしているので、 推定される因子数は、1以上のものを考慮すると scree プロットを待つまでもなく、 上の固有値の値から6であるが、この図を見ると相対的には固有値は6番目から7番 目にかけては変化していないとみれる。
つぎに、共通性を1とした場合の相関行列の因子分析(この場合、実質的には 主成分分析)の回転前の因子パターン (factor pattern) が出力されるが、通常は これを用いた因子の解釈は行わないので、無視してよい。
最後に、抽出された6因子により説明される分散(これは、上で出力された 固有値の値に外ならない) (variance explained by each factor) と、各変数の 最終的な共通性 (final communality estimates) が出力される。ただし、これらの 結果も、因子数の推定が主目的であるこの分析では不要であるので、参考程度の ものと考えればよい。
|
つぎに、共通性に SMC を充てた場合の相関行列の固有値とその比率等が 出力される。
Eigenvalues of the Reduced Correlation Matrix: Total = 25.2189866 Average = 0.86962023 1 2 3 4 5 Eigenvalue 11.6623 4.9030 2.1714 1.9420 1.2458 Difference 6.7593 2.7316 0.2294 0.6962 0.3351 Proportion 0.4624 0.1944 0.0861 0.0770 0.0494 Cumulative 0.4624 0.6569 0.7430 0.8200 0.8694 6 7 8 9 10 Eigenvalue 0.9107 0.6363 0.5344 0.4218 0.3461 Difference 0.2743 0.1019 0.1126 0.0757 0.1102 Proportion 0.0361 0.0252 0.0212 0.0167 0.0137 Cumulative 0.9055 0.9307 0.9519 0.9686 0.9824 ............................................. ............................................. 26 27 28 29 Eigenvalue -0.0544 -0.0662 -0.0865 -0.1029 Difference 0.0118 0.0203 0.0164 Proportion -0.0022 -0.0026 -0.0034 -0.0041 Cumulative 1.0101 1.0075 1.0041 1.0000 5 factors will be retained by the MINEIGEN criterion. |
上の結果は、このようにして出力される筆跡データの相関行列の固有値とその 比率である。これを見ると、共通性を1とした場合の前の結果と比較して固有値が 少し異なっていることがわかる。既に述べたように、この方法による推定因子数の 下限値はゼロ以上の固有値を持つものであるので、その基準からはこのデータの場合、 推定因子数は20となる。これは明らかに過大評価されている。もっとも、この プログラムでは mineigen=1.0 なる指定を行っているので、上の出力の最後には5 因子が推定されたと示されている。
つぎに出力されるのは、共通性に SMC を充てた場合の相関行列の全固有値の値 の変化の様子のプロット結果である。
Initial Factor Method: Principal Factors Scree Plot of Eigenvalues | | 12.5 + | | 1 | | 10.0 + | E | i | g | e 7.5 + n | v | a | l | u 5.0 + 2 e | s | | | 2.5 + | 3 4 | | 5 6 | 78 9 0 0.0 + 1 23 4 5 6 78 9 0 1 23 4 5 6 78 9 | -------+--------+--------+--------+--------+--------+--------+------- 0 5 10 15 20 25 30 Number |
既に述べたように、Tucker らの研究 (1969) からは、共通性が全般に大きい時 には、SMC による全固有値の値の変化を検討し、固有値の値が急に落ちる手前までの 因子数を推定因子数とするとよい。上のプロット結果をこの点から検討すると、急に 落ちてからなだらかになるところは、第3、第4固有値で一ケ所、第5、第6固有値 で一ケ所、第7、8、9、10で一ケ所、第11固有値以降で一ケ所と、合計四ケ所 である。それらのうち、最後の二ケ所は固有値の値をみると小さすぎるので除外 するとして、最初の二ケ所を検討すると、第4固有値から第5固有値への落差の方が 第6固有値から第7固有値への落差より大きいので、上の結果からは4因子と見做す のが妥当であろう。
つぎに、共通性を SMC とした場合の相関行列の因子分析の回転前の因子パタ ーン (factor pattern) が出力されるが、通常はこれを用いた因子の解釈は行わ ないので、analysis-1 の場合と同様無視してよい。
最後に、抽出された5因子により説明される分散(これは、上で出力された 固有値の値に外ならない) (variance explained by each factor) と、各変数の 最終的な共通性 (final communality estimates) が出力される。ただし、これらの 結果も、因子数の推定が主目的であるこの分析では不要であるので、analysis-1 の 場合と同様無視してよい。
つぎの analysis-3 でも simple オプションを削ってあるので、平均と 標準偏差の情報は出力されず、まず相関行列の対角要素に推定された各行の相関 係数の絶対値最大なもの(正確にはその絶対値)による共通性の値が出力される。
Initial Factor Method: Principal Factors Prior Communality Estimates: MAX VAR1 VAR2 VAR3 VAR4 VAR5 VAR6 0.563018 0.812484 0.460549 0.894524 0.850926 0.698459 VAR7 VAR8 VAR9 VAR10 VAR11 VAR12 0.589461 0.779129 0.732491 0.849640 0.896191 0.841160 VAR13 VAR14 VAR15 VAR16 VAR17 VAR18 0.896191 0.800711 0.913137 0.717415 0.635399 0.639773 VAR19 VAR20 VAR21 VAR22 VAR23 VAR24 0.794700 0.944512 0.776683 0.779129 0.617485 0.773575 VAR25 VAR26 VAR27 VAR28 VAR29 0.820196 0.944512 0.812484 0.410692 0.332764 |
つぎに、共通性に各行の絶対値最大なものを充てた場合の相関行列の固有 値とその比率等が出力される。
Eigenvalues of the Reduced Correlation Matrix: Total = 21.5773915 Average = 0.74404798 1 2 3 4 5 Eigenvalue 11.5626 4.7951 2.0485 1.7801 1.0720 Difference 6.7676 2.7466 0.2684 0.7080 0.3643 Proportion 0.5359 0.2222 0.0949 0.0825 0.0497 Cumulative 0.5359 0.7581 0.8530 0.9355 0.9852 6 7 8 9 10 Eigenvalue 0.7077 0.4884 0.3881 0.2535 0.2148 Difference 0.2193 0.1003 0.1346 0.0388 0.0962 Proportion 0.0328 0.0226 0.0180 0.0117 0.0100 Cumulative 1.0180 1.0406 1.0586 1.0704 1.0803 ............................................. ............................................. 26 27 28 29 Eigenvalue -0.2044 -0.2238 -0.2593 -0.3002 Difference 0.0194 0.0355 0.0409 Proportion -0.0095 -0.0104 -0.0120 -0.0139 Cumulative 1.0363 1.0259 1.0139 1.0000 5 factors will be retained by the MINEIGEN criterion. |
上の結果からは、1以上の固有値なる基準より5因子が推定される。
つぎに出力されるのは、共通性に相関行列の行(または列)の絶対値最大 なものを充てた場合の相関行列の全固有値の値の変化の様子のプロット結果である。
Initial Factor Method: Principal Factors Scree Plot of Eigenvalues | | 12.5 + | 1 | | 10.0 + | | E | i 7.5 + g | e | n | v 5.0 + 2 a | l | u | e 2.5 + s | 3 4 | 5 | 6 78 0.0 + 9 0 1 23 4 5 6 78 9 0 1 23 4 5 6 78 9 | | | -2.5 + | | -------+--------+--------+--------+--------+--------+--------+------- 0 5 10 15 20 25 30 Number |
上の結果からは、4因子か5因子か決めかねる。
これまでの出力結果を総合すると、筆跡データの因子数は4因子から6因子までの
いずれかと推定される。analysis-2 の結果からは、4因子が妥当であろう。ただし、
最終的な推定因子数は、因子の心理学的有意味性や統計学的有意性なども考慮して
最終的に決定するのが望ましいであろうから、この時点では因子数は4因子から6因子
の範囲と見做し、それぞれの因子数を指定した因子分析を再度行い、因子軸の回転を
試み、最終的な判断を慎重に行うのがよかろう。
つぎに示すように、これを行う前にさらに最尤因子分析法を用いて統計学的な角 度からも因子数を検討することも1案であるが、どうしても行わなければいけない というわけではなかろう。
つぎのプログラムでは、筆跡データの最尤因子分析法による因子数推定のための
プログラムを示す。SAS の最尤因子分析法では、以下に示すように1つの factor
プロシジャのみで因子数の検定を行うことはできず、因子数を n= オプションで
1回ごとに指定し、ゼロ因子及び当該因子数に関する帰無仮説を検定しなければ
ならない。
もっとも、だからといって1因子から考えられる最大の因子数までをすべて検定
する必要はないであろう。例えばこのデータの場合、主因子法で因子数は4因子から
6因子の範囲だということが推定されている場合は、4因子から始めて7因子ぐらい
までの範囲で最尤因子分析を行ってやれば十分であろう。なぜならば、一般にユーザが
因子分析を行う場合、サンプル数は変数数に対して十分なだけでなく、100とか
200のサイズになることが多いであろう。このような場合、一般に最尤因子分析法
では、例えば芝 (1972, p.186) によれば、サンプル数が多くなると検出力が増し、
与えられた相関行列を説明するのに必要な因子数が多くなるという。
ただし、もし主因子法で推定した因子数の下限値(このデータでは、4)で
検定して帰無仮説(4因子で十分)が採択されてしまった場合は、逆に3、2、と
因子数を少なくして再度最尤因子分析法を実行させなければならない。
いずれにせよ、注意すべきは最尤因子分析法における帰無仮説は、当該因子で (相関行列を)十分説明できる、というものであるので、因子数の検定は、より少ない 因子数から始めて行き、初めて帰無仮説が採択されたところで終了させなければ いけない点である(初めて棄却されたところではない!)。
*--------------------------------------------------- October 22, 1998 | | sas program--fact_ml.sas-- | | A sas program for maximum likelihodd factor analysis. | | | | file name: $HOME/sasprog/multivar/fact_ml.sas | | | *---------------------------------------------------------------------*; options pagesize=60; libname sasfile '$HOME/sasset/others'; title 'ML-FA for Fujii data with four factors'; proc factor data=sasfile.handout nocorr method=ml priors=m hey n=4; var var1-var29; run; title 'ML-FA for Fujii data with five factors'; proc factor data=sasfile.handout nocorr method=ml priors=m hey n=5; var var1-var29; run; title 'ML-FA for Fujii data with six factors'; proc factor data=sasfile.handout nocorr method=ml priors=m hey n=6; var var1-var29; run; title 'ML-FA for Fujii data with seven factors'; proc factor data=sasfile.handout nocorr method=ml priors=m hey n=7; var var1-var29; run; |
fact_ml.sas |
上のプログラムの最初の factor プロシジャは、4因子指定で筆跡データの最尤
因子分析を行うためのものである。method=ml は、最尤因子分析法を指示している。
もちろん、n=4 が4因子を指示している。
つぎの priors=m は、主因子法のプログラムのところで既に説明したように、共通性
の初期推定値として相関行列の行(又は列)の絶対値最大なものの絶対値を充てる
ことを指示している。最尤因子分析法の場合でも、もちろんいろいろな共通性の
推定が可能であるが、最尤因子分析法自身がかなり cpu 時間を消費するので、ここでは
共通性として SMC を用いず cpu の負荷を少なくするために、うえの絶対値の方法を
指定した。
このプロシジャのもう1つのオプションである hey は、最尤因子分析法特有の
問題を回避する1つの手立てに関するものである。テキスト 3.3.3 節で紹介した
ように、最尤因子分析法では共通性が1を越えてしまうケースがありうる。このような
いわゆるヘイウッド ケース (Heywood case) が反復解法の途上で生じた場合にそれら
を強制的に1とするのが、この指示である。
残りの3つの factor プロシジャについては、説明を要しないであろう。
5) 筆跡データの最尤因子分析法・因子数推定プログラムの出力結果の見方
上述の最尤因子分析法・因子数推定プログラムを実行すると、つぎのような結果が 得られる。つぎの結果は最初の4因子指定の結果に関するものであるが、同様な結果が 各指定因子ごとに出力されるので、それらについては省略する:
Initial Factor Method: Maximum Likelihood Significance tests based on 50 observations: Test of H0: No common factors. vs HA: At least one common factor. Chi-square = 1640.500 df = 406 Prob>chi**2 = 0.0001 Test of H0: 4 Factors are sufficient. vs HA: More factors are needed. Chi-square = 429.406 df = 296 Prob>chi**2 = 0.0001 Chi-square without Bartlett's correction = 587.18756873 Akaike's Information Criterion = -4.812431267 Schwarz's Bayesian Criterion = -570.7712409 Tucker and Lewis's Reliability Coefficient = 0.8517760711 |
上の結果から、2つの検定結果が読み取れる。まず、第1の検定はゼロ因子の検定
であり、帰無仮説(共通因子はない)のもとで標本から計算された $\chi^2$-値以上
の確率 Prob$>$chi**2 = 0.0001 から、少なくとも1因子は存在することがわかる。
SAS では、指定因子数がゼロでない場合でも常にこの帰無仮説も同時に検定し出力
することに注意したい。
第2の検定は、4因子で説明できる(十分である)というもので、出力結果からは
同様にしてこの仮説も棄却されていることがわかる。すなわち、このデータの共通因子
は4因子より大であることになる。
上の結果を見ると、SAS の最尤因子分析では、検定の後に幾つかの指標も出力される ことがわかる。これらのうち、AIC などは検定を離れて全く別の視点からモデルを 選択するための有効な方法であり、重回帰分析と同様、AIC の最小なモデルを選択 することになる。これについては後で7因子までの値を比較することにしよう。
検定結果の出力に引き続き、各種情報から因子パターン、各因子により説明 される因子の分散や最終的な共通性の推定値までの情報が出力されるが、因子数の 検定のためには不要なので無視すればよい。
出力は、5因子指定から7因子指定時まで、各因子について上の項目1から
5までが繰り返される。したがって、ユーザは各々の検定結果の個所のみを見ていき、
当該因子数に関する帰無仮説が初めて採択される時の因子数を、最終因子数とすれば
よい。
最後に、各因子での検定結果のうち、P-値と AIC のみをまとめるとつぎのように なる(出力結果ではない!):
指定因子数 4 5 6 7 Prob 0.0001 0.0030 0.0279 0.1398 AIC -4.81 -69.09 -80.37 -90.33 |
この結果からは、危険率をもし1%水準に取るならば、4因子および5因子では
帰無仮説は棄却されるが、6因子目で採択されることになる。サンプル数が多い
場合は、有意水準は高めに(値は低めに)見積もった方がよいだろう。ここで
は1%水準に設定することにすれば、筆跡データの因子数は6因子ということになる。
ただし、AIC の値からは第7因子めが最小になっており、もうすこし大きな因子
数になる可能性もある。
AIC による判断は行わないとすると、この結果(6因子)は主因子法による推定 因子数4から6の上限値になっている。主因子法の結果も考慮するとすれば、筆跡 データの因子数はこれらの真ん中を取り5とするのが1案である。
つぎのプログラムは、因子数推定後の主因子法プログラムである。これまでの 結果から、筆跡データの因子数を一応5と推定したが、念のためここでは4因子解 と5因子解の両方を求め、解釈可能性を探ることにする。このデータの5因子解は 既に 2.7.2 節で共通性の初期推定を相関行列の行(又は列)の絶対値最大値を充てた 場合については紹介しているので、ここでは共通性に SMC を充てる方法により 求めることにする。
*-------------------------------------------------- November 29, 2018 | | sas program--fact_var.sas-- | | example 2 of sas programs for preliminary factor analysis. | | | | file name: $HOME/sasprog/multivar/fact_var.sas | | | *---------------------------------------------------------------------*; */ libname sasfile '$HOME/sasset/others'; */ libname sasfile "/folders/myfolders/permfile"; options pagesize=60; title 'principal FA for the Fujii data/ 4-factor solution '; proc factor data=sasfile.Fujiiraw nocorr priors=s n=4 r=v re; var img1-img29; run; title 'principal FA for the Fujii data/ 5-factor solution '; proc factor data=sasfile.Fujiiraw nocorr priors=s n=5 r=v re; var img1-img29; run; |
fact_var.sas |
factor プロシジャのオプションのうち、2.7.2 節では rotate=v と書いた因子軸
の回転のオプションは、ここでは略記して r=v と書いている。re(reorder の略)
オプションは、第1因子から順に因子負荷量の絶対値の大きい変数を選び出し、
変数をそれらの順に並べ換えて、どの変数がどの因子に関係が深いかを見やすくし、
因子の命名を容易にするためのものである。
上のプログラムを実行すると、つぎのような結果が出力される:
因子分析では、多くの場合得られた因子パターン(因子負荷行列)を心理学的 により有意味なものにする目的で、座標回転する。この項で出力される因子パターン は、そのような回転の前の段階のものであるので、因子の解釈には用いないことが 多い。したがって、この出力結果は無視することにする。この出力結果の最後には、 回転前の各因子により説明される因子の分散も出力されるが、これについても無視 する。
つぎに、4次元解における最終的な共通性の推定値が出力される。これらの 値は、最終的な回転後の因子パターンの右端に各変数ごと表示する必要がある。
Initial Factor Method: Principal Factors Final Communality Estimates: Total = 20.678785 IMG1 IMG2 IMG3 IMG4 IMG5 IMG6 0.549222 0.543109 0.158018 0.896753 0.900323 0.792421 IMG7 IMG8 IMG9 IMG10 IMG11 IMG12 0.442962 0.863275 0.826796 0.797558 0.896942 0.868000 IMG13 IMG14 IMG15 IMG16 IMG17 IMG18 0.856226 0.849094 0.900408 0.905550 0.682480 0.503250 IMG19 IMG20 IMG21 IMG22 IMG23 IMG24 0.754220 0.920047 0.807663 0.775411 0.534813 0.657869 IMG25 IMG26 IMG27 IMG28 IMG29 0.846321 0.902066 0.780268 0.268495 0.199225 |
つぎに、因子軸のバリマックス回転のための直交変換行列 (orthogonal transformation matrix) が出力されるが、通常はこれは必要ないので無視してよい。
つぎに出力されるのが、回転後の因子パターンであり、これを見て各因子の 解釈と命名を行うことになる。最後に最終的な各因子の因子寄与が出力される。 これらの値も、最終的な因子パターンの各行の最後に因子寄与として追加する必要 がある。
Rotated Factor Pattern FACTOR1 FACTOR2 IMG20 0.92920 0.06529 IMG26 0.92761 0.03918 IMG5 0.92273 -0.18526 IMG15 0.90422 -0.04391 IMG4 0.88014 -0.21349 IMG14 0.82866 0.27861 IMG19 0.81419 0.04687 IMG25 0.81063 -0.32744 IMG24 0.77879 -0.04850 IMG12 0.77676 0.06974 IMG2 0.69129 0.14035 IMG18 0.69125 0.09464 |
IMG16 0.63763 0.63056 IMG7 0.63648 0.17600 IMG23 -0.63607 -0.13385 IMG27 -0.79376 -0.24234 IMG11 0.08096 0.90883 IMG13 -0.00235 0.88007 IMG10 -0.05602 0.84706 IMG6 0.27836 0.83207 IMG28 -0.11027 0.47981 IMG29 0.20962 0.24204 sd-scale for the image of holographs IMG22 -0.06055 0.08113 IMG8 -0.28002 0.30696 IMG21 0.42961 -0.05217 IMG9 0.42515 0.11610 IMG1 0.08152 0.05801 IMG17 0.12722 0.45997 IMG3 -0.01101 -0.01506 FACTOR3 FACTOR4 IMG20 -0.15823 0.16531 IMG26 -0.20005 -0.00730 IMG5 0.12072 -0.00142 IMG15 -0.15555 0.23806 IMG4 -0.24478 0.12890 IMG14 0.23772 0.16819 IMG19 0.28144 0.09954 IMG25 -0.28616 -0.00986 IMG24 -0.19954 -0.09581 IMG12 0.03993 0.50812 IMG2 -0.20428 -0.06162 IMG18 -0.12109 0.04257 IMG16 -0.12334 0.29354 IMG7 0.03785 0.07383 IMG23 0.24146 -0.23241 IMG27 0.29006 0.08572 IMG11 0.17641 0.18246 IMG13 0.27311 0.08427 IMG10 0.25145 -0.11701 IMG6 -0.09553 -0.11605 IMG28 -0.04611 0.15490 IMG29 0.21925 -0.22053 sd-scale for the image of holographs IMG22 0.85987 0.16058 IMG8 0.82929 0.05404 IMG21 -0.75942 0.20894 IMG9 -0.13075 0.78452 IMG1 0.07177 0.73079 IMG17 -0.25824 0.62292 IMG3 0.08429 0.38803 Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 FACTOR4 10.799777 4.447072 2.966353 2.465583 |
主因子法による主因子解は、直交因子解の1つであるので、テキスト (3.7) 式より
$\mbphi$ が単位行列になる。したがって、もとの変数と共通因子との相関 $\mbP$ は
$\mbA$ すなわち因子パターン(因子負荷行列)そのものとなる。言い換えれば、直交
解では因子パターンの各要素(因子負荷量)が、もとの変数と各共通因子との相関
係数になっているので、各因子の解釈と命名を行うためには、各因子ごと相関係数
の絶対値の高いもののみをピックアップし、それらの変数に共通するものとして適切
な因子名を与えればよい。既に述べたように、そのためには re (reorder) オプション
を factor プロシジャのオプション欄に指定してやればよい。これにより、変数が
上のように並べ換えられて出力されるので、大変便利である。
このことを利用して筆跡の4因子を解釈し命名すると、つぎのようになる:まず、
第1因子に負荷の高い項目を因子負荷量の絶対値の大きい順に幾つかあげると、項目
20(よいー悪い)、26(読みやすいー読みにくい)、5(ていねいなー雑な)、
15(字形が整っているー字形が整っていない)、等となる。そこで、ここではこの
因子を「筆跡の評価因子」と名づけることにする。
同様に、第2因子については、それらは項目11(強いー弱い)、13(重いー
軽い)、10(線が太いー線が細い)、6(大きいー小さい)である。そこで、第2
因子は、「筆跡の力強さの因子」と名づけることにする。
第3因子は、項目22(角ばったー丸っこい)、8(硬いーやわらかい)に高い
負荷量を示している。また、項目21(なめらかなーこつこつした)に負の高い負
荷量を示している。このような負荷量の正負は、項目の意味内容が反対であるた
めに起こる。例えばこの場合、項目21が負の負荷量であるので、意味内容
を「なめらかなーこつこつした」から、「こつこつしたーなめらかな」に変えてやる
と、他の2項目との意味内容(の方向)が一致することがわかる。
このような場合、データをコード化する時点でこのような反転項目については
最初から評定尺度のコード値を反転しておくことも可能であるが、そのような作業は
面倒であり必要ない。いずれにせよ、上の結果から第3因子は、「筆跡の滑らかさ
の因子」と名づける。
第4因子は、項目9(鋭いー鈍い)、1(右上がりー右下がり)、17(抑揚が
あるー抑揚がない)、12(しまりがあるーしまりがない)に高い負荷を示しており、
「筆跡のアクセント因子」と名づけることにする。
最後に、同一データに対して行った第2章での因子分析結果での因子パターンと ここでの SMC を共通性の初期推定値として充てた結果とを比較してみよう。ここでは、 4因子を指定していること、さらに第2章での因子分析結果は共通性に相関行列の 行(又は列)の絶対値最大値を充てているという点が異なるにもかかわらず、両方の 因子パターンは細部にわたりきわめて似通っていることがわかる。
これまでにその例を議論してきた主因子法による主因子解は、数ある因子分析の
解法の中で最もよく使われ、よく知られた方法である。しかし、場合によってはつぎ
に簡単にその使い方を紹介するアルファ因子分析は、テキスト 3.2.2 節で述べた
ように、因子の信頼性を最大にするようにして求めるもので、因子の信頼性にウエイト
を置いた分析を行おうとする時、有用なものであろう。
この方法に対して、研究者の中には、主因子法で因子解を求めておき、得られた
因子パターンから因子負荷の高い項目のみをピックアップし、それらによる信頼性
係数を求めるという2段階の分析を行う者もいるが、それならば最初からアルファ
因子分析を行った方がはるかに合理的であり、余分な手間も取らないであろう。
つぎのプログラムは、筆跡データのアルファ因子分析に先立ち、因子数を推定する ためのものである。method=a が、アルファ因子分析を指定するものである。この 方法の場合、固有値が1以上の因子の数で因子数を推定する。SAS では、アルファ 因子分析の場合、共通性の default は SMC となっている:
*-------------------------------------------------- October 23, 1998 -* | sas program--fact_pr2.sas-- | | example 2 of sas programs for preliminary factor analysis. | | | | file name: $HOME/sasprog/multivar/fact_pr2.sas | | | *---------------------------------------------------------------------*; libname sasfile '$HOME/sasset/others'; options pagesize=40; title 'alpha FA for the Fujii data'; proc factor data=sasfile.Fujiiraw nocorr method=a mineigen=1.0 scree; var img1-img29; run; |
fact_pr2.sas |
9) 筆跡データのアルファ因子分析法・因子数推定プログラムの出力結果の見方
前頁のプログラムを実行させると、つぎのような結果が得られる:
ここでの出力結果は、主因子法で SMC を用いた既述の analysis-2 における と同一の結果であるので、省略する。
つぎに、共通性に SMC を充てたアルファ因子分析の固有値とその比率等が出力 される。共通性は SMC と、同一であるが、テキスト 3.2.1 節でまとめたように固有値 問題は主因子法と若干異なるので、ここで出力される固有値の値も SMC の場合と 比べて異なる。
Preliminary Eigenvalues: Total = 29 Average = 1 1 2 3 4 5 Eigenvalue 12.9236 5.4742 2.5862 2.2967 1.5205 Difference 7.4493 2.8880 0.2895 0.7761 0.3046 Proportion 0.4456 0.1888 0.0892 0.0792 0.0524 Cumulative 0.4456 0.6344 0.7236 0.8028 0.8552 6 7 8 9 10 Eigenvalue 1.2159 0.8407 0.6570 0.5588 0.4334 Difference 0.3752 0.1837 0.0982 0.1253 0.1612 Proportion 0.0419 0.0290 0.0227 0.0193 0.0149 Cumulative 0.8971 0.9261 0.9488 0.9681 0.9830 ......................................... ......................................... 26 27 28 29 Eigenvalue -0.0617 -0.0782 -0.1017 -0.1289 Difference 0.0165 0.0235 0.0272 Proportion -0.0021 -0.0027 -0.0035 -0.0044 Cumulative 1.0106 1.0079 1.0044 1.0000 6 factors will be retained by the MINEIGEN criterion. |
固有値1以上の基準から、6因子が推定されることがわかる。
つぎに出力されるのは、共通性に SMC を充てた場合のアルファ因子分析による 相関行列の全固有値の値の変化の様子のプロット結果である。
Initial Factor Method: Alpha Factor Analysis Scree Plot of Eigenvalues | | | | 15 + | | | 1 | E | i | g 10 + e | n | v | a | l | u | 2 e 5 + s | | | 3 | 4 | 5 6 | 78 9 0 0 + 1 23 4 5 6 78 9 0 1 23 4 5 6 78 9 | | | --------+--------+--------+--------+--------+--------+--------+-------- 0 5 10 15 20 25 30 Number |
アルファ因子分析による因子数の推定を固有値1以上と考えると、このような 全固有値の値の変化の様子のプロットの必要はないが、参考のため出力した。
つぎのプログラムは、因子数推定後のアルファ因子分析プログラムである。アルファ 因子分析解も主因子解と同様、回転可能であるが、回転により信頼性の値も変るの で、ここでは回転は行わないことにした。SAS では回転法(r= オプション)の default は、回転なしであるので、以下のプログラムでそれを指定したことになる。
*-------------------------------------------------- October 23, 1998 -* | sas program--fact_alp.sas-- | | example 2 of sas programs for alpha-factor analysis. | | | | file name: $HOME/sasprog/multivar/fact_alp.sas | | | *---------------------------------------------------------------------*; libname sasfile '$HOME/sasset/others'; options pagesize=60; title 'alpha FA for the Fujii data/ 6-factor solution'; proc factor data=sasfile.Fujiiraw nocorr method=a n=6 re; var img1-img29; run; |
fact_alp.sas |
11) 筆跡データのアルファ因子分析プログラムの出力結果の見方
上のプログラムを実行すると、つぎのような結果が出力される:
つぎに、反復近似による共通性の推定値を用いた重み付き縮退相関行列 (the weighted reduced correlation matrix) の固有値とその比率等が出力される。
つぎに、各因子のアルファ係数が出力される。
Coefficient Alpha for each factor FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 FACTOR6 0.964233 0.865230 0.690670 0.617309 0.413181 0.235603 |
この結果を見ると、推定された6因子のうち4因子まではかなり信頼性が 高いことがわかる。
つぎに、回転前のアルファ因子分析による因子パターンが出力される。
Initial Factor Method: Alpha Factor Analysis Factor Pattern FACTOR1 FACTOR2 IMG20 0.95018 -0.05903 IMG15 0.92911 -0.14454 IMG26 0.91710 -0.12981 IMG4 0.87658 -0.34104 IMG12 0.83560 0.10402 IMG5 0.83462 -0.18346 IMG14 0.81009 0.30153 IMG16 0.77470 0.50138 IMG25 0.77396 -0.49323 IMG19 0.74944 0.11220 IMG24 0.74232 -0.21330 IMG18 0.70581 -0.00095 IMG2 0.70049 -0.01615 IMG7 0.63126 0.11502 IMG9 0.58854 0.13364 IMG21 0.57631 -0.36506 IMG23 -0.72432 0.01256 IMG27 -0.83181 -0.01910 IMG13 0.08964 0.91651 IMG11 0.20934 0.89832 IMG10 0.00102 0.81020 IMG6 0.37872 0.65163 IMG8 -0.36246 0.64495 IMG28 -0.00947 0.42843 IMG17 0.33815 0.38620 IMG29 0.15333 0.23539 sd-scale for the image of holographs IMG22 -0.17164 0.48404 IMG1 0.21766 0.20667 IMG3 0.04703 0.09020 FACTOR3 FACTOR4 IMG20 -0.02184 0.01979 IMG15 0.03279 0.09365 IMG26 -0.12266 -0.09179 IMG4 -0.01805 0.06350 IMG12 0.13386 0.30779 IMG5 -0.33300 0.22240 IMG14 -0.16824 0.18620 IMG16 0.19735 -0.14902 IMG25 -0.08410 -0.02229 IMG19 -0.26450 0.31177 IMG24 -0.11861 -0.07310 |
IMG18 -0.11257 -0.05344 IMG2 -0.07482 -0.09856 IMG7 -0.12284 0.02983 IMG9 0.55455 0.32050 IMG21 0.48360 -0.28535 IMG23 -0.06625 0.05103 IMG27 0.08596 0.24889 IMG13 -0.05145 -0.17768 IMG11 0.10106 -0.18294 IMG10 -0.12156 -0.26052 IMG6 0.02963 -0.41136 IMG8 -0.30067 0.43487 IMG28 0.30169 -0.13116 IMG17 0.58229 -0.05325 IMG29 -0.31045 -0.05567 sd-scale for the image of holographs IMG22 -0.33537 0.63495 IMG1 0.48271 0.51184 IMG3 0.28611 0.35457 |
主因子法の場合と同様、アルファ因子分析の6因子解を上の因子パターンをもとに
解釈すると、最初の2因子は主因子法による4因子解のそれらとほぼ一致し、それぞれ
「筆跡の評価因子」と「筆跡の力強さの因子」とみれる。第3因子も主因子法による
4因子解の第4因子に似ているが、よくみると少し異なる。第4因子に負荷の高い
項目22、及び1からは、この因子の解釈は難しい。第5、6因子になると、さらに
解釈が難しくなる。
それでは、少なくともこのデータの場合、アルファ因子分析による6因子のうち 第3因子以降は意味のないものなのであろうか。この点については、ここですぐに そのような結論を出すことは避けるべきであろう。なぜならば、主因子法による主 因子解のバリマックス回転結果は、あくまでも因子の心理学的解釈可能性を高める ことを目指した1つの結果であるのに対して、アルファ因子分析による結果はそれ とは異なる因子の信頼性を高めることを目指した1つの結果であり、2つの方法の 目標が原理的に異なるからである。どちらが、より適切なものであるかは例えば因子の 妥当性(予測的妥当性や内容的妥当性など)の基準に照らして別の角度から結論を 下す必要があろう。
Factor Pattern FACTOR5 FACTOR6 IMG20 -0.04617 0.11444 IMG15 -0.14161 0.20103 IMG26 0.01771 0.13388 IMG4 -0.00883 0.06413 IMG12 -0.24291 0.06730 IMG5 0.01198 0.12782 IMG14 -0.01963 0.15523 IMG16 -0.04055 0.08855 IMG25 -0.13834 0.14300 IMG19 0.13900 0.16170 IMG24 0.08271 0.04646 IMG18 -0.03895 -0.13648 IMG2 0.45229 -0.14819 IMG7 -0.07480 -0.02911 IMG9 -0.25602 0.00553 IMG21 0.17985 -0.05125 IMG23 0.25058 0.46864 IMG27 -0.28794 0.11881 IMG13 -0.15729 -0.11866 IMG11 -0.13897 0.01268 IMG10 -0.04974 0.01144 IMG6 0.38305 0.02601 IMG8 -0.02760 0.06045 IMG28 0.19400 0.37552 IMG17 -0.27953 -0.00897 IMG29 0.01373 -0.19962 sd-scale for the image of holographs IMG22 0.06311 0.12187 IMG1 0.09981 -0.37929 IMG3 0.47363 -0.09603 Variance explained by each factor FACTOR1 FACTOR2 FACTOR3 FACTOR4 FACTOR5 FACTOR6 Weighted 14.489276 6.075115 3.001687 2.475385 1.663710 1.294463 Unweighted 11.564554 4.828050 1.963329 1.893119 1.132575 0.822514 |