第4章 その他の多変量解析

Eric's color bar icon

 この節では、因子分析・重回帰分析・共分散構造分析以外の分析方法の幾つかについての適用例及び SAS プログラムのダウンロードコーナーを用意してあります:

4.1 はじめに
4.2 対応分析の概要
4.3 判別分析の概要
4.4 対応分析・重回帰分析・判別分析の逐次的使用例
4.5 ロジスティック回帰分析の概要
4.6 判別分析・ロジスティック回帰分析の逐次的使用例
4.7 ロジスティック回帰分析による色の好悪の分析例

 この節には、つぎの SAS プログラムのダウンロードコーナーがあります:

1.対応分析・重回帰分析・判別分析併用のプロ グラム例
2.判別分析のプログラム例
2. ロジスティック回帰分析のプログラム例1(比例オッズモデル)
2. ロジスティック回帰分析のプログラム例2(通常の2値反応変数)

Eric's color bar icon

このページは、平成30年5月9日に更新しました。

4.1 節 はじめに

 このテキストでは、多くの多変量解析の方法のうち最も基本的な2つの方法、すな わち重回帰分析と因子分析について述べたが、多変量解析もしくはより広義には多 次元データ解析の方法にはこれら以外にも多くの方法がある。例えば、重回帰分析 における基準変数が定性的要因の場合の判別分析 (discriminant analysis)、 同じく基準変数が複数の場合の正準相関分析や多変量回帰分析、因子分析をその 特殊形として含む共分散構造分析 (covariance structure analysis) などは、 よく知られた方法である。SAS では、これらの方法はそれぞれ、discrim、cancorr、 calis、の各プロシジャにより実行できる。

 また、多変量解析というより多次元データ解析というべき方法で、応用範囲の広い方法に、林の数量化の方法(あるいは、数量化理論、数量化) IIIIIIIV 類 がある。まず、数量化 I 類 は、説明変数が定性的要因の場合の重回帰分析である。数量化 II 類は、説明変数が定性的要因の場合の判別分析である。数量化 III 類は、定性的変数の場合の因子分析的方法である。数量化 IV 類は、eij 型数量化とも呼ばれ、一種の多次元尺度構成法である。これらのうち、数量化 III 類については、SAS にこれと同等の対応分析 (correspondence analysis) があり、coresp プロシジャで実行可能である。その他、1種の因子分析的方法として、クラスター分析 (cluster analysis)、多次元分類データのための対数線形モデル (log-linear model) なども有用な方法である。

 また、近年数理統計学の分野で開発されてきた一般化線形モデル (generalized linear model) や、非線形混合モデル (nonlinear mixed model) 、一般化線形混合モデル (generalized linear mixed model) は、

などから、今後心理学などの社会行動科学の分野のデータ解析に多用されるであろう。これらは、SAS では、genmod、nlmixed、glimmix プロシジャにより実行できる。対数線形モデルやロジスティック回帰分析 (logistic regression) は、一般化線形モデルの先駆けとして位置づけられる。SAS では、前者は genmod プロシジャや catmod プロシジャで、後者は logistic プロシジャや genmod プロシジャでそれぞれ実行可能である。

Eric's back icon

4.2節 対応分析の概要

4.2.1. 対応分析(数量化 III 類)のためのデータの一般形と例

 対応分析 (the correspondence analysis) は、一言で言えば、定性的変数の組についての因子分析的方法と言える。最も単純なケースは、被験者の Yes-No 型(もしくは 0-1 型データ、あるいは2値データ)の組であり、例えば、この節の後半で取り上げる中出(1994)の例では、大学生126名に対するバウムテストに描かれた絵の特徴を94の2値データとしてコード化したもので、当該被験者がある項目の特徴を持った木を描いた場合1とコード化し、そのような特徴を持った木を描いていなければ0とコード化することにより得られたものである。その結果、各被験者のデータは、木の特徴を表す2値データの並び(プロフィール)として特徴づけられる。

 2値データの場合の対応分析データの一般形は、表 4.2.1 のようになる:

表4.2.1: 2値データの場合の対応分析データの一般形
被験者番号2値データ反応
1 δ11 , δ12 , ... , δ1m
2 δ21 , δ22 , ... , δ2m
...
N δN1 , δN2 , ... , δNm

 ここで、δij は、被験者 i の第 j 変数への反応で、Yes の(あるいはその変数の特徴を持っている)場合1、No の(あるいはその変数の特徴を持っていない)場合0、とコード化する2値反応であるものとする。対応分析では、このような反応は2値反応に限らず、各変数は多肢選択肢からなる多値反応でもよい。その場合の1つのやり方は、各変数の多値反応を当該選択肢数から成る2値反応の列に変換する方法である。この場合、もとの多肢選択肢の各選択肢は排反カテゴリーからなるものとする。言い換えれば、被験者はそれぞれの変数の複数の選択肢のうちのいずれか1つのみに反応する場合である。

 2値反応のもう1つのデータ例をあげると、例えば高木 (2007) では、色彩選択の研究で、赤、黄、緑、青、紫、白、グレー、黒、オレンジの9色を提示し、まず直感で1色を選ばせ、さらに被験者が選んだ色のイメージを、26の主として形容詞からなるリストから選ばせた。ちなみに、それらは順に1.怒り、2.うれしい、3.落ち着き、4.癒し、5.大人っぽい、6.楽しい、7.セクシー、8.純粋、9.元気、10.暗い、11.かっこいい、12.明るい、13.冷静、14.ミステリアス、15.悲しい、16.自然、17.さわやか、18.やる気がある、19.情熱、20.安らぎ、21.冷たい、22.清純、23.あいまい、24.無、25.地味、26.あたたかい、であった。これらは、予備調査であらかじめ色のイメージを自由記述させた結果から、度数のある程度以上あるものを選んだ結果得られたものである。この場合、色のイメージは複数選択を可能とした。被験者152名の色のイメージ26語への反応は、152行26列の2値データであり、表 4.2.2 のようになる:

表 4.2.2 色彩のイメージ26語に対する152名の2値反応データ

被験者番号1.怒り2.うれしい  ・・・  25.地味26.あたたかい
1 0 1  ・・・  0 1
2 1 0  ・・・  0 1
3 0 0  ・・・  1 0
4 1 1  ・・・  0 1
 ・・・ 
 ・・・ 
  ・・・ 
151 0 0   ・・・  1 0
152 0 0   ・・・  1 1

4.2.2. 対応分析(数量化 III 類)の目的、特徴とその数理

 対応分析では、このようなデータをもとに、データの内的整合性 (internal consistency) を最大化するように、被験者と項目の双方に数量化得点を付与する。この原理にもとづいた数量化については、古くは導入部で述べた林の数量化法やガットマンなどの 1940 年代の仕事(例えば、Guttman, 1941) があり、その後、ベンゼクリの対応分析 (Benzecri et al., 1973) や Nishisato の双対尺度法 (dual scaling) などがある。詳しくは、例えば西里 (1982) や Nishisato (2007) を参照されたい。

 Guttman (1941) によれば、このようなデータの内的整合性を最大にするには、つぎの3つの方法がある:

  1. 被験者内の得点の分散を最少にし、被験者間の得点の分散を最大にするような数値 xj を、変数(項目) j に付与する。
  2. 変数内の得点の分散を最少にし、変数間の得点の分散を最大にするような数値 yi を、被験者 i に付与する。
  3. 1、2を共に満足するように、各変数(項目j)に xj を、各被験者(被験者 i)に yi を付与する。

ここで、1、2の方法は、それぞれ被験者得点、変数(項目)得点の相関比 (correlation ratio) を最大化する問題に、3の方法は、変数(項目)、被験者の各得点間の相関係数を最大化する問題に帰着できる。つぎに示す方法は、林の数量化 III 類の方式で、変数(項目)のそれぞれ及び被験者のそれぞれに対して(事後的に)付与される数量化得点間の相関係数を最大化する方法である:

(4.2.1)
ここで、

(4.2.2)
(4.2.3)
(4.2.4)

である。また、ここで、

(4.2.5)
(4.2.6)
(4.2.7)
(4.2.8)

である。また、(4.2.5) 式の IM 及び IN は、それぞれ M 次、N 次の単位行列である。

 σx 及び σy 一定とする条件下で、(4.2.1) 式の相関係数を最大にするような項目に対する数量化得点ベクトル x 及び被験者得点ベクトル y は、結果としてつぎの固有値問題(eigenvalue problem) を解くことに帰着できる:

(4.2.9)
ここで、

(4.2.10)
(4.2.11)

である。

 ここで、(4.2.9) 式の固有値問題は、固有値問題と特異値問題の関係から、つぎの行列 F特異値分解 (singular value decomposition)

(4.2.12)

と同等であることが容易に証明できる。また、このような場合、(4.2.12) 式の行列 F特異値 (singular value) σk と、行列 FtF、すなわち上の例では (4.2.9) 式の左辺の行列の 固有値 λk、との間には、「固有値の正の平方根は一般に特異値に等しい」という関係に注意すると、(4.2.9) 式の相関係数ρxy が (4.2.12) 式の行列 F の特異値に等しいことがわかる。実際、統計ソフト SAS では、固有値ではなく特異値を、抽出される各軸の内的整合性の指標として出力しているので、注意が必要である。もっとも、一般に (4.2.9) 式の行列の最大固有値は1であることがわかっており、これは実際の解析の場合、無意味であるので省略しないといけないが、SAS ではこのことを (4.2.12) 式の右辺の行列 Gからその分を差し引いた行列を用いることで対応している。

4.2.3. 対応分析(数量化 III 類)の数理とデータ構造、及び各軸の解釈

 4.2.2. で述べた、対応分析の数理を、データの構造によって特徴づけると、つぎの表のようになる。表 4.2.3 は、表 4.2.2. のもとのデータを、対応分析により得られる各軸の被験者と項目のそれぞれに対する数量化得点により並べ替えた場合の、ある特定の軸におけるデータの反応パターン(データ構造)の架空例を示す。

表 4.2.3 色彩のイメージデータの対応分析による特定の軸での被験者及び項目の、
それぞれの数量化得点による並び替え結果(一部架空例)

被験者番号26.地味10.暗い  ・・・  6.楽しい19.やる気のある
26 0 0  ・・・  0 1
141 0 0  ・・・  1 1
98 0 0  ・・・  1 0
5 0 1  ・・・  1 1
 ・・・ 
 ・・・ 
  ・・・ 
129 1 1   ・・・  1 0
13 0 1   ・・・  0 0
75 1 1   ・・・  0 0

 この表におけるデータの特徴は、もとの表と異なり、データとしての各被験者の1、0の反応パターンが、結果的に得られた各被験者と各項目に対する数量化得点を用いると、可能な限り右上がりの対角線に近いところに1が集中し、表の右下と左上の部分には0が多いパターンになっているといえる。また、前節での固有値の値の大きい軸ほど、このように1が対角線上の近くに集中するという特徴を示す。

 うえの結果を考慮すると、われわれは、対応分析(数量化 III 類)の各軸の解釈を行うことが可能になる。すなわち、表 4.2.3 で表される特定の軸では、被験者グループ 26番、141番、98番等は、本人が直感で選んだ色に対するイメージを「地味」(項目番号26)、「暗い」(同10)とは評価せず、「楽しい」(項目番号6)、やる気のある(同19)などと評価していることがわかる。これとは対照的に、被験者グループ129番、13番、75番等は、本人が直感で選んだ色に対するイメージを「楽しい」(項目番号6)、やる気のある(同19)などとは評価せず、「地味」で「暗い」等と評価していることがわかる。つまり、両被験者群では、本人が直感で選んだ色に対するイメージ(言い換えれば、項目に対する反応パターン)が全く対照的となっているのである。言い換えれば、対応分析では一方では、項目に対する反応パターンにより被験者を少数のグループに分類していることが明らかである。

 同じことは、項目についても言える。すなわち、本人が直感で選んだ色に対するイメージが「地味」で「暗い」などの項目は、特定の被験者群(この例では、26番、141番、98番など)には選択されないが、これとは対照的な特定の被験者群(この例では、129番、13番、75番など)には選択されているような特徴を持つ。つまり、対応分析では、調査に組み込んだ全項目を少数のグループに分類していることになる。対応分析(数量化 III 類)が、項目と被験者の同時分類の方法、と呼ばれるゆえんである

 いずれにせよ、上記の点を考慮すると、われわれは、項目に対する数量化得点のプラス方向の極に近い得点に対応する数項目とマイナス方向の極に近い得点に対応する数項目を選ぶことにより、各軸に対して解釈と命名を行うことが可能になる。例えば、うえの例では、この軸は、「積極性・明るさと消極性・暗さを分ける軸」のように命名できよう。

 さらに、このデータでは、実際、この軸は第1軸に対応するもので、かつイメージ項目「地味」(項目番号26)、「暗い」(同10)はマイナスの極に、「楽しい」(項目番号6)、やる気のある(同19)などはプラスの極に、それぞれあたる数量化得点が付与されていた。その場合、被験者の対する数量化得点を見ると、被験者グループ(26番、141番、98番など)の得点はプラスの極の方向が対応していることになる。一方、被験者グループ(129番、13番、75番など)は、マイナスの極方向の得点が対応している。

Eric's back icon

4.3節 判別分析の概要

4.3.1. はじめに

 判別分析は、基準変数が定性的変数の場合の重回帰分析と言える。重回帰分析では、基準変数は定量的変数(間隔尺度レベル以上の尺度から成る変数)であるが、これが定性的変数(名義尺度レベルの変数)になると、重回帰分析は適用できない。これに代わる方法の1つが判別分析である。

 例えば、黒焦げになった遺体の男女を判別したいとする。この場合、1つの方法は、あらかじめ性別のわかっている例えば男女それぞれ100名の被験者の身体各部の長さを測定し、それぞれに最終的には最適の重みをつけ、各被験者の判別のための得点(これを判別得点という)を計算する。この得点が男女をうまく判別するような性質を持っているならば、われわれは、そこで得られた各変数への重み(これを判別ウエイトという)を、性別の不明な黒こげの遺体に適用し、遺体の判別得点を計算し、遺体の性別を判定することができる。

 判別分析は、そのような最適の重み、すなわち判別ウエイトを求める方法である。もちろん、うえの例では、定性的基準変数は2値データで、例えば、1.男、2.女である。判別分析では、この定性的基準変数は必ずしも2値である必要はなく、一般に2つ以上の群でも構わない。したがって、判別分析のデータの一般形は、表 4.3.1 のようになる:

表4.3.1: 判別分析データの一般形
基準変数の値m 個の説明(判別)変数の値
G1 x11 , x12 , ・・・ , x1m
G2 x21 , x22 , ・・・ , x2m
・・・
GN xN1 , xN2 , ・・・ , xNm

ここで、表中 Gi は、被験者 i の属する群の番号とする。判別分析では、説明変数は原則的には、重回帰分析と同様、定量的変数であるが、ダミー化(1-0 化したもの)することにより定性的変数も組み込むことは不可能ではない。

4.3.2. 判別分析のモデル

 判別分析のモデルは、通常

(4.3.1)

と書かれる。ここで、zi(k) は、第 i サンプルの第 k 判別得点であり、基準変数としての K 個の群の判別のために用いられる。一般に、このような判別式は、群が K 個の場合、K-1 個計算できる。つまり、上の式で k=1, 2, ..., K-1 である。また、β1(k) , ... ,βm(k) は一般に、判別ウエイト と呼ばれる。
 SAS では、判別ウエイトとして、構造係数の総和、群間の構造係数、プールした群内の構造係数、全標本の標準化正準相関係数、プールした群内の標準化正準相関係数、非標準化正準相関係数、の6種類を出力する。このうち、「プールした群内の標準化正準相関係数」を利用するのがよかろう。
 (4.3.1) 式の判別得点の群による違いを見るためには、この判別得点の平均値を群ごとに計算し、各判別軸ごとに比較すれば、各軸が何を判別する軸であるのかを推論できる。SAS では、各群毎の判別得点の平均値は、上記6種類の判別ウエイトの直後に「正準変数における群平均」というタイトルで出力される。

Eric's back icon

4.4 節 対応分析・判別分析の逐次的使用例

4.4.1. 中出(1994)のバウムテストとモーズレイ性格検査データ

 この研究(中出、1994)では、A 大学2年次生126名に対してバウムテストとモーズレイ性格検査を実施し、両者の関連性を探った。バウムテストの特徴は、従来の研究を参考にして作成した94項目(右に傾いた木を描いているか、根元の膨らみを強調して描いているか、一線枝が描かれているか、地面の線を強調しているか、花を描いているか、など)を用いて判定している。

 また、これらのデータは、それぞれの特徴を被験者が持った絵を描いていれば1、 描いていなければゼロとしてコード化した。以下の SAS プログラムでは、これらの 項目には baum1 から baum94 なる変数名であらかじめ永久 SAS ファイル化された ものを SAS セッション上に呼び出して使っている。また、モーズレイ性格検査の得 点は、mpi1 から mpi4 なる変数名で永久 SAS ファイルに定義された。4尺度は順に、 外向ー内向、神経症的傾向、虚偽尺度、疑問尺度である。また、この研究では、バウ ムテストの「枠付け効果」の検討も行っている。枠のありなし、の条件は、その順序 効果も見る目的で同一被験者に2カ月強の間隔で2回バウムテストを実施し、1回目 の枠ありなしをframe なる変数で、2回目のそれを frames なる変数で、それぞれ 永久 SAS ファイルで定義されている。永久 SAS ファイル名は、 sasfile.grad であ るとする。

4.4.2. 中出(1994)データの分析のための SAS プログラム例

 バウムテストと性格検査の関連の検討には、まず最初に94項目の対応分析を 行い、得られた各軸の解釈を行った後、以下のプログラムで対応分析の各軸の数量化 得点とモーズレイ性格検査相互間の相関係数を計算したり、各軸の数量化得点を 基準変数とし性格検査の4尺度を説明変数とする重回帰分析を行った。また、枠あり なしの効果の検討には、その2群を判別群とし、対応分析により得られた5軸の数量 化得点を判別変数とする判別分析を用いた。

*-------------------------------------------------- October 28, 1998 -*
|  sas program--crsp_ex1.sas--                                        |
|      A sas program for executing correspondence analysis.           |
|  data.  This data was gathered by Hiroko Nakade (1994).             |
|                                                                     |
|  file name: $HOME/sasprog/multivar/crsp_ex1.sas                     |
|                                                                     |
*---------------------------------------------------------------------*;
libname sasfile '$HOME/sasset/multivar';
options ps=60;

  /* Delete samples whose responses are all zero or one. */
data work;
  set sasfile.grad;
  ndel=0;
  nvar=94;
  total=sum(of baum1-baum94);
  if total=. or total=0 or total=nvar then do;
    ndel=1; delete; end;
run;

  title 'crsp for responses to, at most, 94 items'; 
proc corresp data=work short dimens=5 outc=coord;
  var baum1-baum94;
run;

data config;
    /* obs must be equal to the number of samples plus 1 */
  set coord(firstobs=2 obs=127);
  keep dim1-dim5;
run;

data temporal;
  merge work config;
run;

  title 'correlations between MPI and baum';
proc corr data=temporal;
  var dim1-dim5 mpi1-mpi4;
run;
  title 'multiple reg./criterion=baum dimensions';
proc reg data=temporal;
  model dim1-dim5=mpi1-mpi4;
run;
  title 'cross table between items, frame and frames';
proc freq data=temporal;
  tables frame*frames;
run;
  title 'canonical discr./criterion=frame';
proc discrim data=temporal can ncan=1;
  class frame;
  var dim1-dim5;
run;

--- バウムテストと性格との関連等についての多変量解析プログラム例1 ---

4.4.3. SAS プログラム例の概要

 うえのプログラムで、最初の data 文では、94項目からなるバウムの特徴の有無を表す二値項目(1又は0とコード化してあるものとする)の得点をまず一人分づつ合計し、合計点が欠側値になっているか、ゼロか、あるいは総項目数に等しい場合は、当該被験者のデータを一時的に削除するためのものである。

 これが終了したら、corresp プロシジャで、94項目の二値データに対して対応分析(あるいは数量化 III 類)を施し、5軸までの項目に対する数量化得点と同被験者に対する数量化得点を求める。

 つぎに、得られた5軸の被験者に対する数量化得点(これらは、dim1 から dim5 なる、ユーザ指定の変数のエリアに保存する。これは、corresp プロシジャの直後の data 文により指示してある。ここで、そこでのコメントに書いておいたように、set coord 文で指定するべき第1サンプルの番号は常にプログラムに書いたように firstobs=2 とし、obs のサンプル数は、実際の被験者数プラス1、としなければならないので、注意せよ。ここで、保存すべきデータは、config なるユーザ指定の一時ファイルである。

 つぎの data 文では、うえのようにして得られた2種類のファイル work、及び configファイルを被験者(サンプル)を行として結合させるための merge 文を用いている。結合したデータの出力先は、やはりユーザ指定の一時ファイル temporal である。これが完了すると、一時ファイル temporal を用いて、以降のプログラムではつぎつぎと corr、reg、freq、discrim の各プロシジャを実行して、

描画枠の有無(変数 frame)を判別群とし、バウムの94項目の対応分析から得られた被験者の5軸の数量化得点(これらは、被験者が描いたバウムの特徴を凝縮させたものとみれる)を判別のための変数とした判別分析(discrim プロシジャのオプションに can を指定しているので、正準判別分析を指示)、

などを行っている。

4.4.4. 上記プログラムのダウンロードコーナー

Eric's abar10 icon

crsp_ex1.sas

Eric's back icon

4.5節 ロジスティック回帰分析の概要

Eric's back icon

4.5.1. ロジスティック回帰分析のデータとモデル

 判別分析と同様、基準変数(反応変数ともいう)が定性的変数の場合の重回帰分析的方法にロジスティック回帰分析がある。この方法は、もともと基準変数が二値の定性的変数のモデルとして開発されたものであるが、最近では多値でなおかつ順序尺度レベルで測定されているようなデータの場合にも拡張されている。まず、基準変数が二値の場合の伝統的なロジスティック回帰分析のデータの一般形を示すと、表 4.5.1 のようになる。ここで、B1、B2、...、BN は、各サンプルの基準変数(反応変数)の値で、二値変数を表すものとする。

表4.5.1: 伝統的なロジスティック回帰分析データの一般形
基準変数の値m 個の説明変数の値
B1 x11 , x12 , ・・・ , x1m
B2 x21 , x22 , ・・・ , x2m
・・・
BN xN1 , xN2 , ・・・ , xNm

 このようなデータに対する伝統的なロジスティック回帰分析モデルは、つぎのようである。ここで、基準変数の二値データは、被験者がある群に属する時1、属さない時例えば0であるとする:

(4.5.1)

ここで、式の左辺の pi は、被験者 i がある群に属する母比率(確率)であるとする。また、pi/(1-pi) は、一般にオッズ (odds) と呼ばれ、さらにその対数をとった値はロジット (logit) と呼ばれることに注意すると、ロジスティック回帰分析では、二値変数としての基準変数に対して、そのロジットが説明変数の重み付き合計点で表せるという仮定を置いていると言える。また、もともとロジスティック回帰分析では説明変数には定量的変数を仮定するが、現在では説明変数は定性的変数であっても定量的変数であってもよく、それらが混じっていてもよい。SAS では、logistic プロシジャがこれらに対応している。

 ただし、もし説明変数の中に定性的変数がある場合には、このモデルは少し異なる形を取る。例えば、もし第 j 変数が定性的変数で、選択肢(カテゴリー)が nj 個から成るとする。この時、後に紹介する SAS の変換の1つである GLM コーディングのような特別な場合を除き、通常の変換では、もとの変数 xij を、nj-1 個の0、1型の二値変数 (これはダミー変数(dummy variable) と呼ばれる)の列 (Dij,1、 Dij,2、...、Dij,nj-1)に置き換える(その変換の方式に ついては、後の表 4.5.2 や表 4.5.3 を参照のこと)。ただし、表 4.5.2 の effect coding なる コーディング方式では、マイナス1を取るような場合もあり、SAS ではこのような変数をより一般 的にデザイン変数と呼んでいることに注意せよ。

 その結果、(4.5.1) 式の右辺の第 j 変数の項、βjxij にあたる部分は、つぎのように書き換える必要がある:

(4.5.2)

 また、もし2つの説明変数、xij 及び xik が共に定性的変数であり、それぞれの選択肢の数が順に nj、nk であるとし、両変数間の交互作用項をモデルに組み込みたいとしよう。また、ここで、両変数をダミー変数化したものが、順に

であるとしよう。この時、両変数が連続変数である場合の (4.5.1) 式の右辺の形 βjk xijxik に対して、つぎの形を取る:

(4.5.3)

ここで、(4.5.3) 式の左辺の β の上付添え字 l(エル)は、l = (nk-1)(a-1) + b を表す。

 ここで、(4.5.1) 式の左辺の母比率(確率) pi 、そのオッズ pi/(1-pi)、及びロジットの三者の関係については、つぎのような関係がある。すなわち、まずpiとそのオッズの関係は、pi が0から1に変化すると、そのオッズはゼロから∞へと単調増加する関係にある。さらに、オッズがゼロから∞へと単調増加すると、ロジットは -∞ から ∞ へと単調増加する関係にある。したがって、piとロジットの関係は単調増加の関係となるので、ロジットが大きくなれば母比率(確率)も大きくなり、ロジットが小さくなれば母比率も小さくなる。

 このことに注意すると、つぎのことが言える。すなわち(4.5.1)式のモデルからは、

Eric's back icon

4.5.2. ロジスティック回帰分析におけるオッズ比やその信頼区間の推定

 前節で述べたように、ロジスティック回帰分析では、反応変数と当該説明変数との関連について、オッズ比を用いて検討できる。ただし、つぎに見るように、その扱いは説明変数が定性的変数か定量的変数かにより若干異なる。