1.1節 カテゴリー変数の度数分布と変数間の関連性の有無の検定

Eric's color bar icon

 この節は、つぎの4項から成り立っています:

1. 度数分布・クロス表用データ例
2.永久 SAS ファイル作成用 SAS プログラム
3.度数分布・クロス表用 SAS プログラム
4.STATISTICA による度数分布・クロス表作成手順

 この節には、つぎの2つの SAS プログラムのダウンロードコーナーがあります:

1.永久 SAS ファイル用プログラムの例1
2.度数分布・クロス表用プログラムの例

Eric's color bar icon

このページは、令和2年5月6日に一部更新しました。

1. 度数分布・クロス表用データ例

 Table 1.1 のデータは、A 大学 514 名の 新入生に対するある年度の永平寺参禅 調査結果の一部を示している。データは各人ごと、通し番号に続く、参禅への動機の 強さ、参禅の有意義さ、座禅時間の長さ、座禅指導の仕方、指導どうり座禅できたか、 参禅の前後での座禅に対するイメージ変化の方向、今後の学生生活の方向づけに 役立ったと思うか、現代の生活に座禅は必要であり今後も座禅の機会を持ちたいか、 食事はどうであったか、睡眠はどうであったか、法話についての意義の評価、 永平寺の雰囲気はよかったか、の14項目と、それぞれ5段階評定尺度から成る 参禅の前後における座禅に対する態度10項目(計20項目)、の合計34項目 から成る。

Table 1.1; A大学514名の新入生に対する永平寺参禅調査 データ

  1 10 2  3  3  2  2  1  1  4  3  1  4  3  2  22222334333232243332
  4 10 2  5  4  2  3  2  1  3  3  3  4  4  2  22232223232222233233
  5 10 1  5  4  2  2  3  2  3  4  3  2  4  3  22133323222323334232
  6 10 1  4  2  2  2  3  4  4  3  4  2  2  2  22343223222322412222
 11 10 1  5  4  2  2  2  5  4  4  3  2  4  3  23232233333333333333
        .......................................................
        .......................................................
        .......................................................
799  1 1  5  2  2  2  2  4  4  4  4  5  4  2  22222222222222222244
813  1 1  5  2  2  2  2  4  4  4  4  5  3  2  32222334222222222222

 つまり、この調査では、最初の14項目は定性的(カテゴリー)変数であり 名義尺度(中には評定尺度で間隔尺度と見做せるものもあるが)であり、後半の 20項目は一応定量的変数で間隔尺度と見做すことができる。   そこで、まず前半の14項目については、各範ちゅうの度数を数え、後の高度な 分析に備えるとよい。

Eric's back icon

2. 永久 SAS ファイル作成用 SAS プログラム

  そのために、ここでは SAS を用いて、まずデータに変数情報をつけて永久SAS ファイルとして保存しておくと便利である。そのためのプログラムの例を示した のが、つぎの表である。紙面の都合上、2つに分けて示す。

*---------------------------------------------------------------------*
|                                                   November 18, 2000 |
|  sas program--perm_ex1.sas--                                        |
|       example 3 of a sasprogram for making a sas permanent file     |
|                                                                     |
|  file name: $HOME/sasprog/multivar/perm_ex1.sas (Unix), or          |
|  file name: a:¥sasprog¥perm_ex1.sas (Windows)                     |
|                                                                     |
*---------------------------------------------------------------------*;
/*  In the case when you use a Unix machine,
   filename eiheiji '$HOME/educdata/multivar/ds76eihe';
   libname sasfile '$HOME/sasset/multivar'; 
*/
filename eiheiji 'a:¥data¥ds76eihe';
libname sasfile 'a:¥permfile';
options pagesize=66;
data sasfile.eihe;
  infile eiheiji;
  input noss 5. cat1 3. cat2 2. (cat3-cat14) (4.) +2 (con1-con20) (1.);
  label noss='SAMPLE NUMBER'
      cat1='DEPARTMENT NUMBER'
      cat2='SEX'
      cat3='INTENSITY OF MOTIVATION'
      cat4='USEFULNESS OF ZEN PRACTICE'
      cat5='EVALUATION OF THE TIME FOR ZEN PRACTICE'
      cat6='EVALUATION OF ZEN INSTRUCTIONS'
      cat7='COULD PRACTICE ZEN AS WAS INSTRUCTED?'
      cat8='ZEN IMAGE CHANGE THROUGH ZEN PRACTICE'
      cat9='USEFULNESS FOR FUTURE STUDENT LIFE'
      cat10='NECESSITY AND HOPE FOR ZEN PRACTICE'
      cat11='WERE THE MEALS VOLUMINOUS?'
      cat12='COULD YOU SLEEP LAST NIGHT?'
      cat13='USEFULNESS OF ZEN LECTURE'
      cat14='FEEING ABOUT THE ATMOSPHERE OF EIHEIGI'
      con1='ZEN SERVE TO RECOVER OUR MENTAL BALANCE.'
      con2='ZEN IS GOOD FOR MENTAL conCENTRATION.'
      con3='ZEN IS A GOOD CHANCE TO GAZE AT ONESELF.'
      con4='ZEN IS APPROPRIATE FOR conCENTRATION.'
      con5='ZEN GIVE A CHANCE TO EXAMINE ONESELF.'
      con6='IMPOSSIBLE TO RELIEVE A PERSON BY ZEN.'
      con7='ZEN IS MERELY A SELF-conTENTMENT.'
      con8='IT IS UNABLE TO GAZE AT ONESELF BY ZEN.'
      con9='ZEN IS VERY TIRESOME.'
      con10='ZEN IS MERELY A SELF-ABSORPTION.'
      con11='ZEN IS GOOD FOR MENTAL HEALTH.'
      con12='ZEN GIVE A CHANCE TO EXAMINE ONESELF.'
      con13='ZEN IS GOOD FOR MENTAL conCENTRATION.'
      con14='ZEN SERVE TO RECOVER OUR MENTAL BALANCE.'
      con15='ZEN IS A GOOD CHANCE TO GAZE AT ONESELF.'
      con16='INCREDIBLE TO LIKE SUCH A HARD PRACTICE.'
      con17='ZEN IS MERELY A SELF-ABSORPTION.'
      con18='IMPOSSIBLE TO RELIEVE A PERSON BY ZEN.'
      con19='ZEN IS MERELY A SELF-conTENTMENT.'
      con20='IT IS UNABLE TO GAZE AT ONESELF BY ZEN.' ;
run;

--- 永平寺データの永久SASファイル化のためのSASプ ログラム ---

/*
  libname library '$HOME/sasset/format';
*/
libname library 'a:¥format';
proc format library=library;
 value cat1fmt 1='dept.1' 2='dept.2' 3='dept.3' 4='dept.4' 5='dept.5'
               6='dept.6' 7='dept.7' 8='dept.8' 9='dept.9' 10='dept.10';
 value cat2fmt 1='male' 2='female';
 value cat3fmt 1='very strong' 2='fairly strong' 3='weak'
               4='very weak'   5='can not clasify';
 value cat4fmt 1='very useful' 2='useful' 3='somewhat useful'
               4='do not know' 5='somewhat useless' 6='very useless';
 value cat5fmt 1='short'     2='appropriate' 3='long';
 value cat6fmt 1='too severe' 2='appropriate' 3='more severely';
 value cat7fmt 1='yes' 2='dk' 3='no';
 value cat8fmt 1='good to good' 2='good to dk' 3='good to bad'
               4='dk to good'   5='dk to dk'   6='dk to bad'
               7='bad to good'  8='bad to dk'  9='bad to bad';
 value cat9fmt 1='very useful' 2='fairly useful' 3='somewhat useful'
               4='dk'         5='not so useful'  6='not useful at all';
 value cat10fmt 1='definitely' 2='think so'   3='a bit'
                4='dk'         5='rather not' 6='not at all';
 value cat11fmt 1='very voluminous' 2='rather voluminous' 3='as usual'
                4='not voluminous'  5='not at all';
 value cat12fmt 1='yes, sufficient' 2='yes, a little'  3='dk'
                4='no, not well'    5='no, not at all';
 value cat13fmt 1='very useful' 2='fairly useful' 3='somewhat useful'
                4='dk'      5='not so useful'   6='not useful at all';
 value cat14fmt 1='very good' 2='good' 3='rather good' 4='no feeling'
                5='not so good' 6='not good at all';
run;
proc print data=sasfile.eihe n;
 title 'data on the Eiheiji zen practice in 1976';
run;

--- 永平寺データの永久SASファイル化のためのプログラム(続き)---

 ここでプログラムの後半部を削ると、カテゴリー変数の各コードに対応する カテゴリー名が出力結果に表示できない。しかし、なくてもかまわない。

プログラムのダウンロード・コーナー

Eric's abar10 icon

perm_ex1.sas

Eric's back icon

3. 度数分布・クロス表用 SAS プログラム

 永久 SAS ファイルが完成すると、後はこれを呼びだしてつぎのような数行の プログラムを書いてやると、カテゴリー変数の各範ちゅうへの度数が出力される。

*-------------------------------------------------------------------*
|                                                 November 18, 2000 |
|  sas program--freq_ex1.sas--                                      |
|       example 3 of a sasprogram for freq procedure                |
|                                                                   |
|  file name: $HOME/sasprog/multivar/freq_ex1.sas (Unix), or        |
|  file name: a:¥sasprog¥freq_ex1.sas (Windows)                   |
|                                                                   |
*-------------------------------------------------------------------*;
/*
libname sasfile '$HOME/sasset/multivar';
libname library '$HOME/sasset/format';
*/
libname sasfile 'a:¥permfile';
libname library 'a:¥format';
options pagesize=60 ls=80;
  title 'frequency distribution with format';
proc freq data=sasfile.eihe;
  tables cat1-cat4;
  format cat1 cat1fmt. cat2 cat2fmt. cat3 cat3fmt. cat4 cat4fmt.;
run;
  title 'frequency distribution without format';
proc freq data=sasfile.eihe;
  tables cat1-cat4;
run;
  title 'contingency table with cell-chisquares';
proc freq data=sasfile.eihe;
  tables cat2*cat6/expected cellchi2 chisq;
  format cat2 cat2fmt. cat6 cat6fmt.;
run;
  title 'contingency tables with cell-chisquares';
proc freq data=sasfile.eihe;
  tables (cat1-cat3)*cat4/expected cellchi2 chisq nocol norow;
  format cat1 cat1fmt. cat2 cat2fmt. cat3 cat3fmt. cat4 cat4fmt.;
run;

--- 永平寺データの度数分布及び分割表の検定のためのプログラム---

プログラムのダウンロード・コーナー

Eric's abar10 icon

freq_ex1.sas

Eric's back icon

Eric's eye-bar icon

4. STATISTICA による度数分布・クロス表作成手順

 STATISTICA により、上記の SAS プログラムで指示したとほぼ同様な結果を得る ための手順を以下に列記する。中心的課題は、cat1-cat4 (STATISTICA 用にはこれら は var2 から var5 が対応)の度数分布表及びヒストグラム、及び cat2 と cat7 のクロス表作成と当該クロス表の2辺数間の関連性の有無の検定である:

  1. STATISTICA を起動

  2. 基本統計/集計表 (sta_bas.exe) をクリック

  3. 出力結果の印刷方法の指定

     「基本統計/集計表」画面で、ファイル→出力の設定、とクリックし、 「印刷・出力の設定」画面で、テキスト・グラフ共自動出力に設定 (詳細は、 STATISTICA についての初心者向け FAQの質問5や同6を参照のこと)

  4. データの入力

     スプレッドシート画面にデータを直接入力するか、パソコンのフロッピー なりハードディスクのあるフォルダに保存されているデータファイルを呼び 出すかのいずれか。ここでは、データはハードディスクのあるフォルダに保 存されているものとした時の手順を示す:

     

    1. この時点では、2.の指定で「出力ウインドウ」がアクティブになって おり、「データを開く」オプションが指定出来ない。そこで、まず スプレッドシート画面をまずクリックし、アクティブにする。
    2. つぎに、ファイル→データを開く、とクリックし、「データファイル を開く」ウインドウを表示させ、データの保存してあるフォルダを選択 し、必要なファイルをスプレッドシート上に読み込ませる。

  5. 度数表の選択

     つぎに、「「基本統計/集計表」画面で、「分析」プルダウンメニューを クリックしながら、多くのメニューのうちの「度数表」メニューをダブル クリックするか、クリックした後 OK ボタンを押す。

  6. 度数表画面での操作

    1. 左上端の「変数」バーをクリックし、「変数を指定」画面を表示
    2. 「変数を指定」画面が現れたら、変数リストの中から度数分布表を作成 したい変数のみ(この場合、var2 から var5 まで)をクリックして指定 する。(連続して指定したければ、マウスを指定したい変数の先頭でクリック し、そのままマウスを指定すべき最後の変数までドラッグさせる。これに 対して、飛び飛びの変数を指定したければ cntl キーを押したまま、必要 な変数をクリックすればよい。また、全ての変数を選択したければ、画面 右下方の「すべて選択」バーをクリックすればよい)
    3. 指定した変数の度数表を作成するには、「度数表」画面の上方の「度数表」 を再度クリックする。途中で「継続」ボタンが現れたら、その都度それを クリックする。
    4. 必要ならば、同じく「度数表」画面の上方の「ヒストグラム」をクリック し、各変数のヒストグラムも描かせるとよい。やはり、途中で「継続」ボ タンが現れたら、その都度それをクリックする。
    5. 必要ならば、同じく「度数表」画面の上方の「記述統計量」をクリック し、各変数の平均、標準偏差、最大、最小値を計算させるとよい。途中で 「継続」ボタンが現れたら、その都度それをクリックする。
    6. 最後に「度数表」画面を×印をクリックして閉じる。

  7. クロス表画面での操作

    1. 「度数表」画面を閉じ、それにより再度現れる「基本統計/集計表」画面 で、「クロス表集計/多重回答」をダブルクリックして開く。

    2. グループ変数の選択

       つぎにクロス集計をするための変数の指示が必要になる。そのためには、 「クロス集計表」画面で、「変数の指定」バーをクリックし、「グループ 変数の選択」画面を開く。STATISTICA では、一般に6重クロス表まで作成 できる。ここでは、var3 と var7 のクロス表を作成したいので、左端の (第1)変数リストから var3 を、左端から2つ目の(第2)変数リスト から var7 をクリックする。すると、画面下の「グループ1」なる枠に 数字 3 が、「グループ2」なる枠には数字 7 が入る。

    3. 「グループ変数の選択」画面右上端の OK ボタンをクリック

    4. クロス表作成用変数の指定の確認

       上の手順でグループ変数を選択した後、それらを参照したり削除したり したいときは、「クロス集計表」画面に戻ったところで、「表の参照/削除」 バーをクリックするとよい。これにより、上で選択した変数のリストを参照 できる。また、この時点で削除したい変数が出てきたら削除しても良い。 どちらにせよ、これを終了したら OK なりキャンセルボタンなりを押す。

    5. 「クロス集計表」画面に戻ったら、OK ボタンをクリック

  8. 「クロス集計表の結果」画面での表のアイテムや統計量の指定

     直前の手続きにより、つぎに「クロス集計表の結果」画面が現れる。この 画面には「表」欄と「クロス集計表の統計量選択」欄が用意されている。 そこで、まず画面右上の「表」欄から必要と思われるアイテム(通常、期待 度数、行相対度数、列相対度数、全体相対度数を選択するとよい)をクリック する。つぎに画面左下の「クロス集計表の統計量選択」欄で、必要な統計量 を選択する(ここでは、SAS の結果と比較するため、ピアソンと M-L カイ二乗、 フィッシャー、イエーツ、マクネマー、ファイとクラメールの V、C 値等を クリック)

  9. 「クロス集計表の結果」画面で、「クロス集計明細」をクリック

  10. 必要なら、同じく「クロス集計表の結果」画面で、「2変量ヒストグラム」 をクリック

  11. 「クロス集計表」画面に戻ったら、必要なクロス表がさらにあれば、上記 7) から 10) を繰り返す。そうでなければ、「クロス集計表」画面の×印をクリ ックし「クロス集計表」画面を終了させる。

  12. 「基本統計/集計表」画面に戻ったら、×印をクリックし、当該画面を終了さ せる。

  13. テキスト出力ウインドウをアクティブにさせる。

  14. メニューバーから、ファイル→すべて印刷、とクリック

  15. 印刷が終了したら、「基本統計/集計表」画面を×印をクリックし閉じる

  16. 出力結果のディスク保存

     「基本統計/集計表」画面を終了させると、

       名前を変えて保存出力:出力先 C:\ ... \新規.RTF

    と表示されるので、どこに保存するかにかかわらず、まず「はい」をクリックす る。すると、「名前をつけて保存」ウインドウが現れるので、必要ならフォルダ やファイル名を修正して、必要な個所に保存する(この場合、ファイルは Word ファイルになる)。

Eric's back icon

Eric's color bar icon