このページは、令和2年4月27日に一部更新しました。
ここでは、SAS による単純な SPF-p.q デザインの ANOVA 分析を以下の2つのセ クションに分けて示す:
1.7.4.1 SAS による単純な SPF-p.q デザインの ANOVA 分析 とその概要 |
1.7.4.2 SAS による単純な SPF-p.q デザインの ANOVA プロ グラムの出力結果の概要 |
単純な SPF-p.q デザインの ANOVA 分析用プログ ラムの例 |
この節でも、単純な SPF-p.q デザインデータで適当なものが見つからないので、
反復測度 SPF-p.q デザインデータ例をこれに充てることにする。データは、
Morrison (1967) の Table 5.8を用いる。このデ
ータは、以下の SAS プログラムで 1.7.2 節でふれた2ステップ多標本球形検定
を行ってみると、
多標本球形仮定
を満たしているデータ
であることが分かり、1.7.3 節で指摘したように
単純な SPF-p.q デザインデータとみて ANOVA 分析を行えばよいことが分かる
。
以下のプログラムでは、このようなわけで最初は glm の repeated 文を用いて、
ANOVA に関する部分のみは後続の項での repeated 文を用いない 単純な SPF_p.q
デザイン分析のための(glm の repeated 文による結果と同等な結果を出力する)
プログラムが書いてある。
ただし、このデータはもともと反復測度を1つ含むので、1.7.2 節
でも述べたように、主効果や全体的交互作用ひいては反復測度間対比並びに部分的
交互作用の F-比の歪みの有無を、repeated 文を使う分析に先立ち、多標本球形
検定を行うことにより検定する必要がある。
ところで、SAS ではこのようなデータに対して多標本球形検定を
行おうとすると、 repeated 文では 1.7.2 節で述べた (1.222) 式
の第2ステップしか実行できない。もちろん、repeated 文では1ステップ多
標本球形検定は不可能である。
そこで、2ステップ多標本球形検定を現状の SAS で行おうとする時は、glm の
repeated 文による2ステップ多標本球形検定の第2ステップを実行する前に、以下の
プログラムのように discrim プロシジャを用いて第1ステップの共分散行列の
等質性の検定が必要になる。ただし、1.7.2 節で述べたように、その場合われわれは
(1.224) 式の帰無仮説、すなわちもとの反復測度変数間
のそれではなく、正規直交対比により変換された1つ数の少ない (1.220) 式による
それを行わなければならないことに注意が必要である。これを行うには、
やはり 1.7.2 節で述べたヘルマー対比を利用するのが簡単である。
いずれにせよ、この節のタイトルで述べた単純な SPP-p.q デザインデータの場合、
(2-5) の部分の repeated 文を用いない glm プロシジャによるプログラムだけでよ
いし、もちろん反復測度 SPF-p.q デザインの時のような多標本球形仮定も不要であ
るし、MANOVA の分析の時のようなもとの反復測度間の共分散行列の等質性や多変量
正規性の仮定も不要であることに注意せよ。
プログラムは、以下に示すように、9項から成る。もし単に単純な SPF_p.q デザインデータの ANOVA 分析を行うには、これらのうち最小限 (1)、及び (2-5) の項を実行すればよい:
*-----------------------------------------------------------------------* | December 1, 1998 | | sas program--spf4-3mr.sas -- | | A sasprogram for repeated measures SPF-p.q design ANOVA analyses | | by two ways of glm procedure. Data is from Table 5.8, p.191, of | | Morrison (1967). | | | | Reference | | | | Morrison, D. F. (1967). Multivariate Statistical Method. New York: | | McGraw-Hill. | | | | Caution! | | | | Type II SS and Type III SS are different in this case. Since the | | design is unbalanced, specification of the Type II SS seems to be | | appropriate. | | | *-----------------------------------------------------------------------*; |
ここでは、冒頭のコメントを記述している。
options ps=60 ls=80; /* data input */ data work; input (group block) (1.) (scale1-scale3) (3.); label group='socioeconomic class' block='level of the second block factor' scale1='A scale of a maternal attituds' scale2='B scale of a maternal attituds' scale3='C scale of a maternal attituds'; cards; 11 19 20 18 12 20 21 19 13 19 22 22 14 18 19 21 15 16 18 20 16 17 22 19 17 20 19 20 18 15 19 19 21 12 14 12 22 15 15 17 23 15 17 15 24 13 14 14 25 14 16 13 31 15 14 17 32 13 14 15 33 12 15 15 34 12 13 13 41 8 9 10 42 10 10 12 43 11 10 10 44 11 7 12 ; |
この項では、本来は必ずしも反復測度を含まない SPF_p.q デザインデータを読み 込まねばならないにもかかわらず、ここではたまたま上記のような反復測度変数 (scale1 から scale3) を含む SPF_p.q デザインデータを読むためのプログラムを 示す。したがって、本来の第2ブロック因子に対応する上記プログラムにおける 変数 block は、ここでは独立測度要因 group の各水準の被験者になっている点に 注意されたい。
データは、冒頭の項に記したように Morrison (1967) の有名なプロフィール分析 (profile analysis) のためのデータで、21名の母親に対して、ある種の母親の 態度を測定するための3つの尺度(scale1 から scale3)への反応を求めた結果で ある。ここで、21名の母親は4つの社会経済的地位のいずれかのグループに属して おり、GROUP 変数がそれにあたる。
/* (2-1) compute two new variables transformed by orthonormal contrasts */ data work2; set work; orthn1=(scale2-scale1)/sqrt(2); orthn2=(scale3*2-sum(of scale1-scale2))/sqrt(6); run; |
この項では、このデータがもともと反復測定 SPF_p.q デザインデータなので、
要因の効果の検定における F-分布の歪みの有無を検討するために、
多標本球形検定の1つの方法である
2ステップ多標本
球形検定の第1ステップとしての、正規直交対比により変換された変数間の
共分散行列の等質性の検定のためのプログラムを示す。
ここで、反復測定要因の3水準に対応する変数 scale1 から scale3 までは、
上のプログラムにより新たに名前を付けられた変数 orthn1 と orth2 なる2つに
変換される。ここで用いた正規直交対比による変換は、1.7.2 節の表 1.22 に示した
Helmert 対比である。
/* (2-2) test for homogeneity of covariance matrices on orthonormalized variables */ title 'Bartlett test for homogeneity of covariance matrices'; proc discrim data=work2 pool=test slpool=0.05; class group; var orthn1-orthn2; run; |
この項では、2ステップ多標本球形仮説の検定の第1段階として、(2-1) のプロ グラムで正規直交対比により変換された変数間の共分散行列の等質性の検定を、 discrim プロシジャを用いて行うためのプログラムを示す。var 文で指定する 変数名は、もとの反復測定要因の3変数ではなくて、Helmert 対比を用いて変換 後の2変数であることに注意されたい。
/* (2-3) SPF-4.3 ANOVA using proc glm repeated statement */ title 'SPF-4.3 ANOVA for the Morrison data via the repeated statement'; proc glm data=work; class group; model scale1-scale3=group/ nouni ss2; repeated ascale 3 profile/ summary printe; output out=temp residual=resid; run; |
この項では、ここで利用しているもともと反復測定デザインである Morrison の
データを repeated 文を使って反復測定デザイン ANOVA として分析するための
プログラムを示す。
このプログラムでは、反復測定 SPF_4.3 デザインの独立測定要因には group、
反復測定要因には scale1 から scale3 なる変数名がつけてある。repeated 文に
おける ascale はこの反復測定要因につける変数名である。また、その右側の3
は、反復測定要因の水準数である。これにより、出力結果には同要因名として
のみならず、profile で具体的に指示される対比変数名としてもこのラベルが
つけられる(ASCALE.1、ASCALE.2 として)。
前節での正規直交対比により変換後の変数間の共分散行列の等質性の検定と、
ここで行われる反復測定変数に対する球形検定の対が、2ステップ多標本球形
検定を構成することに注意されたい。
/* means plot using proc summary */ title 'plot the means for each cell'; proc summary nway print data=work; class group; var scale1-scale3; output out=new mean=ms1-ms3; run; data xyplot; set new; array av(3) ms1-ms3; do scal=1 to 3; aver=av(scal); output; end; drop ms1-ms3; run; options ps=40 ls=80; proc plot data=xyplot; plot aver*scal=group; run; |
この項では、SPF_p.q デザインデータの平均値のプロットを行わせるための プログラムを示す。平均値の計算に際して、1.6.6 節での2要因共反復測定要因 の場合と異なり、summary プロシジャでは class 文を追加し、独立測定要因の 水準ごとに反復測定要因の各水準の平均値を計算する必要がある。
/* (2-5) SPF-4.3 ANOVA using proc glm test statements, which is equivalent to the (2-3) analysis */ data work3; set work; array ma(3) scale1-scale3; do facts=1 to 3; matat=ma(facts); output; end; run; options ps=60 ls=80; title 'SPF-4.3 ANOVA for the Morrison data via glm test statements'; proc glm data=work3; class block group facts; model matat=group facts group*facts block(group) facts*block(group)/ ss2; test h=group e=block(group); test h=facts e=facts*block(group); test h=group*facts e=facts*block(group); run; |
この項では、データがこの場合のようにたとえ反復測定 SPF_p.q デザインデータ
であっても多標本球形仮説が成り立っている場合、もしくは反復測定デザインではない
単純な SPF_p.q デザインデータの ANOVA 分析のための glm プロシジャによるプログ
ラムを示す。
model 文での右辺の要因の指定は、1.7.1 節で述べた分
割区画デザインのモデル (1.217) 式に従って書き下したものである。例えば、モデ
ル式におけるブロック因子の効果 BLk(i)は、上の SAS プログラムの
model 文では、block(group) に対応する。
このデータは、非釣り合い型デザインデータでありかつ交互作用項を含むデザイン
なので、model 文の最後のオプションを見ればわかるように、平方和は
高橋ら (1990) に従って Type II を指定してある。
もしここで、model 文のオプションに何も指定しないもしくは例えば Type III 平方
和を指定すると、(2-3) の項での repeated 文による要因の効果の F-検定の値の
1つはここでの test 文による F-検定の結果と異なるものとなるので、注意され
たい。
最後に、このデザイン(SPF デザイン)のような標準的でない誤差構造の場合には
repeated 文を使わないこの例のようなプログラムでは、model 文だけでは、SAS は
平方和までは出力するが、F-値等は出力しないので、上のプログラムのように test
文を用いて、要因名と誤差項の変数名を指示しなければならない。
/* (3-1) posterior analysis (1) */ options ps=40 ls=80; title 'histogram of the error estimates '; proc chart data=temp; vbar resid; run; |
/* (3-2) posterior analysis (2): test for normality of error estimates */ options ps=60 ls=80; title 'test for global normality of the dependent variable'; proc univariate data=temp normal; var resid; run; |
spf4-3mr.sas |
うえのプログラムを実行すると、以下のような出力結果が得られる:
Test Chi-Square Value = 12.484955 with 9 DF Prob > Chi-Sq = 0.1873 Since the chi-square value is not significant at the 0.05 level, a pooled covariance matrix will be used in the discriminant function. Reference: Morrison, D.F. (1976) Multivariate Statistical Methods p252. |
この項では、プログラムの (2-2) の項での判別分析プログラムを利用した、反復 測定変数の正規直交対比による変換後の2変数に関するグループ間の共分散行列の 等質性の検定結果を示す。Bartlett の検定結果から、2ステップ多標本球形検定 の第1ステップである正規直交対比による変換後の2変数に関するグループ間の共 分散行列の等質性は、5パーセント水準で採択される。
(2-2) の項の判別分析を実行させ、上のような共分散行列の等質性の検定結果が 出力された後には、一般の判別分析で出力されるその他の各種情報が同時に出力さ れる。しかしながら、ここでは判別分析の目的は単に共分散行列の等質性の検定 のみなので、後続の判別分析に関わる出力は読み飛ばせばよい。
(2-3) の項の repeated 文による反復測定 SPF_4.3 デザインのグループやサン プル数の情報から始まり、repeated 文の profile で指定した2つの対比変数 間の偏相関行列までの一連の出力結果から成る。これらは読み飛ばせばよい。
Test for Sphericity: Mauchly's Criterion = 0.6275898 Chisquare Approximation = 7.4538963 with 2 df Prob > Chisquare = 0.0241 Applied to Orthogonal Components: Test for Sphericity: Mauchly's Criterion = 0.9652404 Chisquare Approximation = 0.5660489 with 2 df Prob > Chisquare = 0.7535 |
この項では、(2-3) の項のプログラムによる上記 4. の情報に引き続き出力される
反復測定変数の球形検定結果を示す。このデザインは反復測定 SPF_4.3 デザインな
ので、本来多標本球形検定結果が出力されねばならないが、SAS にはそのオプションは
特別には用意されていないので、(2-2) の項での正規直交対比により変換された変
数でのグループ間共分散行列の等質性の検定に引き続き、ここでは多標本球形検定
の第2ステップの位置づけで 1.7.2 節や 2.1.4 節で述べた球形検定を行っている。
上の結果から、とりわけ直交要素に対して適用された球形検定結果を見ると、p-値
から球形仮説は採択されることがわかる。この結果と上の 2. の結果から、この
データの場合、(2ステップ多標本球形検定の結果)多標本球形仮説は満た
されている、と見れる。
Manova Test Criteria and Exact F Statistics for the Hypothesis of no ASCALE Effect H = Type II SS&CP Matrix for ASCALE E = Error SS&CP Matrix S=1 M=0 N=7 Statistic Value F Num DF Den DF Pr > F Wilks' Lambda 0.50128949 7.9588 2 16 0.0040 Pillai's Trace 0.49871051 7.9588 2 16 0.0040 Hotelling-Lawley Trace 0.99485529 7.9588 2 16 0.0040 Roy's Greatest Root 0.99485529 7.9588 2 16 0.0040 |
この項では、repeated 文を伴う glm プロシジャにより付随的に出力される GMANOVA の結果の1つである反復測定要因 ASCALE の主効果の検定結果を示す。この結果から は、GMANOVA によれば ASCALE の主効果は1パーセント以上の高い水準で有意である。
Manova Test Criteria and F Approximations for the Hypothesis of no ASCALE*GROUP Effect H = Type II SS&CP Matrix for ASCALE*GROUP E = Error SS&CP Matrix S=2 M=0 N=7 Statistic Value F Num DF Den DF Pr > F Wilks' Lambda 0.56333190 1.7725 6 32 0.1364 Pillai's Trace 0.48726039 1.8253 6 34 0.1234 Hotelling-Lawley Trace 0.68534343 1.7134 6 30 0.1522 Roy's Greatest Root 0.50884896 2.8835 3 17 0.0662 NOTE: ROY'S GREATEST ROOT のF統計量は上側限界です. NOTE: WILKS のラムダのF統計量は正確です. |
この項では、repeated 文を伴う glm プロシジャにより付随的に出力される GMANOVA の結果の1つである独立測定要因 GROUP と反復測定要因 ASCALE の(全体的)交互 作用の検定結果を示す。この結果から、例えば Roy の最大根基準を用いれば、交互 作用効果は、有意な傾向を持つ。また、ヘック chart のパラメータの1つである s の値が1か2の場合(この場合それに該当)正確な F-統計量となる Wilks のλ基準 でも p-値は 0.1364 となっており、Roy の場合と同一の結論となる。
SPF-4.3 ANOVA for the Morrison data via the repeated statement 12 General Linear Models Procedure Repeated Measures Analysis of Variance Tests of Hypotheses for Between Subjects Effects Source DF Type II SS Mean Square F Value Pr > F GROUP 3 743.9000000 247.9666667 70.93 0.0001 Error 17 59.4333333 3.4960784 |
この項では、repeated 文を伴う glm プロシジャにより出力される独立測定要因 GROUP の主効果の検定結果を示す。これについては、GMANOVA の結果と ANOVA の 結果はもともと一致する。
SPF-4.3 ANOVA for the Morrison data via the repeated statement 13 General Linear Models Procedure Repeated Measures Analysis of Variance Univariate Tests of Hypotheses for Within Subject Effects Source: ASCALE Adj Pr > F DF Type II SS Mean Square F Value Pr > F G - G H - F 2 21.23809524 10.61904762 6.88 0.0031 0.0035 0.0031 Source: ASCALE*GROUP Adj Pr > F DF Type II SS Mean Square F Value Pr > F G - G H - F 6 18.96190476 3.16031746 2.05 0.0860 0.0889 0.0860 Source: Error(ASCALE) DF Type II SS Mean Square 34 52.46666667 1.54313725 Greenhouse-Geisser Epsilon = 0.9664 Huynh-Feldt Epsilon = 1.2806 |
この項では、repeated 文による反復測定 SPF_4.3 デザインの ANOVA 分析結果の
一部を示す。既に直前の 8. の項で示した独立測定要因の主効果とここでの結果が、
当該データのANOVA 分析結果であり、GMANOVA による結果とは反復測定要因を含む
効果(ASCALE、及び ASCALE と GROUP の交互作用)に関しては F-値も p-値も多少
異なることに注意されたい。もっとも、有意水準のレベルではこのデータの場合、
ANOVA の結果と GMANOVA の結果は変わらない。
もちろん、これらの結果はすべて このデータを掲載している Morrison (1967) の
結果と一致している。ただし、 Morrison では、交互作用に関してはヘック chart
を用いて検定している点が異なるが、Roy の最大固有根の値は直前の項の SAS の出
力 0.50884896 と一致する。もっとも、Morrison では固有値計算に関して初歩的な
計算ミスがあり、この値を 0.579 としているが、そこに掲載されている固有方程式
から直接計算すると SAS の結果と一致する。
この項でのもう1つの注意事項は、既に示した上記の項でこのデータの場合多標本
球形仮説が満たされているという点である。このことは、上の ANOVA の結果を見る
に際して、われわれは p-値の修正を必要としない、ことを意味する。
SPF-4.3 ANOVA for the Morrison data via the repeated statement 14 General Linear Models Procedure Repeated Measures Analysis of Variance Analysis of Variance of Contrast Variables ASCALE.N represents the nth successive difference in ASCALE Contrast Variable: ASCALE.1 Source DF Type II SS Mean Square F Value Pr > F MEAN 1 25.19047619 25.19047619 8.36 0.0101 GROUP 3 24.60952381 8.20317460 2.72 0.0766 Error 17 51.20000000 3.01176471 Contrast Variable: ASCALE.2 Source DF Type II SS Mean Square F Value Pr > F MEAN 1 1.19047619 1.19047619 0.33 0.5737 GROUP 3 24.30952381 8.10317460 2.24 0.1207 Error 17 61.50000000 3.61764706 |
この項では、直前の結果に引き続き、(2-3) の項のプログラムによる出力結果の
一部、とりわけ repeated 文による反復測定要因の対比検定結果、及び 1.4.3 節で
既に述べた(ただし、この場合独立測定要因 GROUP を処理とし反復測定要因の特定
の対比を対比とする)処理・対比交互
作用の検定 結果を示す。
ここでの対比は、repeated 文の変換のオプションを profile としたことにより、
第1水準と第2水準の対比 ASCALE.1 及び第2水準と第3水準の対比 ASCALE.2 に
関する検定結果を示す。
うえの結果のうち、MEAN の項に対応する変動因が対比検定であり、GROUP とある
変動因に対応するのが処理・対比交互作用の検定である。結果を見ると、まず
ASCALE.1 すなわち反復測定要因の水準のうちの第1水準と第2水準の対比は5パーセ
ント水準で有意であり、GROUP 要因を処理とし第1水準と第2水準の差を対比とする
処理・対比交互作用は有意な傾向を示していることがわかる。
plot the means for each cell 15 GROUP N Obs Variable Label N Mean ------------------------------------------------------------------------------- 1 8 SCALE1 A scale of a maternal attituds 8 18.0000000 SCALE2 B scale of a maternal attituds 8 20.0000000 SCALE3 C scale of a maternal attituds 8 19.7500000 2 5 SCALE1 A scale of a maternal attituds 5 13.8000000 SCALE2 B scale of a maternal attituds 5 15.2000000 SCALE3 C scale of a maternal attituds 5 14.2000000 3 4 SCALE1 A scale of a maternal attituds 4 13.0000000 SCALE2 B scale of a maternal attituds 4 14.0000000 SCALE3 C scale of a maternal attituds 4 15.0000000 4 4 SCALE1 A scale of a maternal attituds 4 10.0000000 SCALE2 B scale of a maternal attituds 4 9.0000000 SCALE3 C scale of a maternal attituds 4 11.0000000 ------------------------------------------------------------------------------- |
この項では、summary プロシジャによる反復測定 SPF_4.3 デザインの合計12の セルの各々の平均値、標準偏差、最大値、及び最小値を出力する。ここでは、平均値 のみを示した。
plot the means for each cell 17 プロット : AVER*SCAL. 使用するプロット文字: GROUP の値. AVER | | 20.0 + 1 1 | | | |1 17.5 + | | | | 15.0 + 2 3 | |2 3 2 | |3 12.5 + | | | 4 | 10.0 +4 | | 4 | | 7.5 + | -+-----------------------------------+-----------------------------------+- 1 2 3 SCAL |
この項では、直前の 11. の項で計算した各セルの平均値を plot プロシジャにより 描かせた結果を示す。図中、横軸は反復測定要因の3水準を、第1象限の数字は独立 測定要因の水準をそれぞれ示す。
SPF-4.3 ANOVA for the Morrison data via glm test statements 19 General Linear Models Procedure Dependent Variable: MATAT Sum of Mean Source DF Squares Square F Value Pr > F Model 62 896.00000000 14.45161290 . . Error 0 . . Corrected Total 62 896.00000000 R-Square C.V. Root MSE MATAT Mean 1.000000 0 0 15.333333 Source DF Type II SS Mean Square F Value Pr > F GROUP 3 743.90000000 247.96666667 . . FACTS 2 21.23809524 10.61904762 . . GROUP*FACTS 6 18.96190476 3.16031746 . . BLOCK(GROUP) 17 59.43333333 3.49607843 . . BLOCK*FACTS(GROUP) 34 52.46666667 1.54313725 . . |
この項では、(2-5) の項のプログラム、すなわち repeated 文を使わず単純な SPF デザインを分析する場合の glm プロシジャによる出力結果を示す。とりわけ、後半の 各要因やその交互作用の検定では、SAS は F-値や p-値を出力しない。これを出力 させるには、プログラムで示したような test 文により必要な要因名と誤差項を指定 する必要がある。
SPF-4.3 ANOVA for the Morrison data via glm test statements 19 Tests of Hypotheses using the Type II MS for BLOCK(GROUP) as an error term Source DF Type II SS Mean Square F Value Pr > F GROUP 3 743.90000000 247.96666667 70.93 0.0001 Tests of Hypotheses using the Type II MS for BLOCK*FACTS(GROUP) as an error term Source DF Type II SS Mean Square F Value Pr > F FACTS 2 21.23809524 10.61904762 6.88 0.0031 Tests of Hypotheses using the Type II MS for BLOCK*FACTS(GROUP) as an error term Source DF Type II SS Mean Square F Value Pr > F GROUP*FACTS 6 18.96190476 3.16031746 2.05 0.0860 |
この項では、(2-5) の項のプログラムのうち test 文を用いて行った各効果の検定 結果を示す。これらの検定結果は、(2-3) の項の repeated 文を用いた ANOVA で 自由度の修正を行わないケースのそれらと同一であることがわかる。
SPF-4.3 ANOVA for the Morrison data via glm test statements 19 histogram of the error estimates 20 Frequency 8 + ***** | ***** 7 + ***** | ***** 6 + ***** | ***** 5 + ***** ***** | ***** ***** 4 + ***** ***** ***** | ***** ***** ***** 3 + ***** ***** ***** ***** | ***** ***** ***** ***** 2 + ***** ***** ***** ***** | ***** ***** ***** ***** 1 + ***** ***** ***** ***** ***** | ***** ***** ***** ***** ***** -------------------------------------------------------------------- -3.0 -1.8 -0.6 0.6 1.8 RESID Midpoint |
test for global normality of the dependent variable 21 Univariate Procedure Variable=RESID Moments N 21 Sum Wgts 21 Mean 0 Sum 0 Std Dev 1.462874 Variance 2.14 Skewness -0.36859 Kurtosis -0.80891 USS 42.8 CSS 42.8 CV . Std Mean 0.319225 T:Mean=0 0 Pr>|T| 1.0000 Num ^= 0 18 Num > 0 10 M(Sign) 1 Pr>=|M| 0.8145 Sgn Rank 5.5 Pr>=|S| 0.8216 W:Normal 0.940796 Pr < W 0.2220 Quantiles(Def=5) 100% Max 2 99% 2 ................... ................... ................... |