第6章 相関係数とその検定

Eric's color bar icon

 この章は、つぎの10項から成り立っています:

6.1データ
6.2目的
6.3注意事項
6.4問題
6.5予習課題と予習箇所
6.6相関係数の計算手順
6.7相関係数とその検定公式
6.8実習レポートの記入の仕方
6.9 統計ソフト SAS を用いた相関係数の計算及び検定の実行手順

Eric's color bar icon

このページは、平成14年6月1日に開設しました。
このページは、令和2年5月6日午後に一部更新しました

Eric's eye-bar icon

 この章では、2組の定量的変数間の直線的関係の強さを表す指標であるピアソンの 偏差積率相関係数 (Pearson's product-moment coefficient of correlation)(略して 相関係数と呼ばれる)の計算方法と、その有意性検定の方法を学ぶ。

 教育や心理の分野では、しばしば被験者は多くのアンケート項目や検査項目に回答 したり、複数の実験条件に対して反復測定を受ける。このような場合、測定値間には 一般にある種の関連が生じる。測定値がすべて間隔尺度以上のレベルであれば、それ らのうちの任意の2組の測定値を取り上げ、平面上に被験者の各々を点として位置づけ ると、2組の変量間には直線的な関係や曲線的な関係などを読みとることができる。 それらの定量的関係のうち、とりわけ直線的関係の強さを表す指標が相関係数である。

 相関係数の統計的有意性の検定法方は、サンプル数の多少により異なる。ここでは、 サンプル数が小さい場合の検定の手続きを学ぶ。

6.1 データ

 例えばデータは、N 人の被験者の YG 性格検査の抑うつ性と気分の変化の得点で あるとする。一般的には、それらは以下のように書ける:

(一般形) ( x 1 , y 1 ) , ( x 2 , y 2 ) , ... , ( x N , y N ) (N は小)

当日の問題の標本数 N は20である。

6.2 目的

小標本の対データから、2組の定量変数間のピアソンの相関係数を求め、さらに その統計的有意性の検定を行う。

6.3 注意事項

 なし

6.4 問題

卓上計算機を用い、小標本の対データから 散布図 (scatter diagram) を作成し、さらに標本相関係数の計算とその統計的有意性 の検定を行え。

6.5 予習課題と予習箇所

1. 連関と相関について
岩原(著)教育と心理のための推計学/ 第12章 12.1 節  二変数間の関係、 12.8 節 間隔尺度における相関 ピアソンの係数
2. ピアソンの相関係数とその計算方法について
岩原(著)教育と心理のための推計学/ 第13章
3. 相関係数の有意性検定について
岩原(著)教育と心理のための推計学/ 第27章 27.7 節  ピアソンの相関係数の有意性

6.6 相関係数の計算手順

  1. 対データのそれぞれの変数の平均 及び を求める。
  2. 対データのそれぞれの変数の標準偏差 s x 及び s y を求める。
  3. 対データの 共分散 (covariance) s xy を求める。
  4. 相関係数 r xy を求める。
  5. t -検定量を計算する。自由度 ν = N -2 の t -分布の、指定された危険率 に対応する棄却点の値を数値表から読みとり、検定を行う。

Eric's back icon

6.7 相関係数とその検定公式

まず、相関係数は次式で求める:

(6.1)

ここで、(6.1) 式の分子の共分散は、次式で与えられる:

(6.2)

 相関係数の推定・検定は、一般的につぎのようにして行う。

Eric's back icon

6.8  実習レポートの記入の仕方

  1. x の平均、 y の平均
  2. x の標準偏差 ( S x )、 y の標準偏差 ( S y )
  3. 相関係数 ( r xy )
  4. t- 値 ( t )、 t の自由度 ( d .f . )
  5. t-検定結果(棄却、又は採択)

Eric's back icon

統計ソフト SAS を用いた相関係数の計算及び検定の実行手順

 これまで、手計算による相関係数とその検定の計算方法について述べてきたが、 サンプル数が大きくなると、たいへんな手間がかかる。このような作業は 本来人間には向かない。原理さえわかれば、諸君は今やこの種の検定を手計算 でやる時代ではない。以下の2つの例は、国際的な統計ソフト SAS を用いた 相関係数とその検定の手順を示す。

 ここでは、相関係数の計算と検定を行うための SAS プログラムを紹介する。 SAS を実行する手順を示す前に、ここで利用するデータと出力結果の一部、及び そのための SAS プログラムを紹介する。

 この節は、以下に順に示す例について、つぎの4項から成り立っている:

宿題

6.9.1.1データ例とその入力方法
6.9.1.2出力結果の例
6.9.1.3SAS プログラムの例
6.9.1.4SAS による具体的手順

6.9.1.1 データ例とその入力方法

 つぎのデータは、ここでは、心理統計学のテキストの乱数表から取った架空 のデータである。

 1 10 10
 2 96 76
 3 26 61
 4 12 15
 5 97 40
 6 18 17
 7 96 14
 8 57 03
 9 15 14
10 54 55
11 12 83
12 48 79
13 37 20
14 34 67
15 65 10
16 25 75
17 46 06
18 45 07
19 12 98
20 46 71

--- 心理統計学のテキストから取り出した、2変数間の相関係数計算、および 検定のための架空データ例 ---

 学生諸君は、心理統計学テキストの付録の表の中から、各自の通し番号に対応する箇所から、 縦に見て続けて20個を各ページから取り出し、ecip の z ドライブの My Documents -> SASUniversityEdition -> myfolders の下の data フォルダの中にTeraPad を用いてファイル名 corr_scatter.txt なる名前を付けてうえの例のように保存すること。

 ここで、うえの20個のデータの各行は20人の被験者に対応し、各行とも最 初の2桁の数値が被験者番号を、1つ空白を置き2桁で打ってあるのが、p.445 の 各自の学籍番号に対応する20個の値、さらに1つの空白を置き2桁で打ってある のが、p.446 の各自の学籍番号に対応する20個の値であるとする。もちろん、デ ータはすべて全角ではなく、半角で入力せよ。また、被験者番 号が9番までの被験者の被験者番号は、半角スペースを1つ入れた後一桁の被験者 番号を上の例のように入力すること

 学籍番号に対応する各人のデータの先頭は、各ページごと、左上から右下に向かって 2桁の数値を5つづつ飛ばして到達する位置とする。各列の最後に来たら、次の列の先 頭に戻りカウントすること。

 例えば、学籍番号 001 の学生は、p.445 の数値の左最上部の数値から始め、94, 18, ..., 90, 35 までを20名の被験者の第1変数の20個のデータとし、p.446 の数値 の左最上部の数値 70, 99, ..., 95, 45 までの20個のデータを20名の被験者の 第2変数の20個のデータとして、上記データファイルに上の例のように2変数が 対になる形に入力する。

 また、例えば学籍番号 012 の学生ならば、p.445 の数値左最上部から2列目の6つ目 の数値から始め、81, 18, ..., 29, 38 を第1変数のの20個のデータ、p.446 の数 値の左最上部から2列目の6つ目の数値から始め、96, 62, ..., 29, 61 を第2変数 の20個のデータとして、入力する。

6.9.1.2 出力結果の例

 以下の検定結果は、後続の SAS プログラムよって得られたものである。 以下の出力中、標準偏差は SAS では不偏標準偏差であり、サンプル数で割るところの元の標 準偏差とは異なるので、注意せよ。また、以下の出力結果には、相関係数 (この例では、 -0.08693) と p-値 (この例では、0.7155) は示されているが 相関係数の検定のための t 値は出力されていないので、注意せよ。 そこで、検定結果は p-値が 0.05 より大きい場合、採択、0.05 以下の 場合、棄却、と判断し、授業中で手計算した t 値と千野の心理統計テキストの数値表から 判断した「採択または棄却の判断」と比較せよ。

                              correlation and test of the null hypothesis about it                             

                                                CORR プロシジャ

                                          2  変数 :    x        y


                                                   要約統計量

変数    N      平均値    標準偏差        合計      最小値      最大値  ラベル

x      20    42.55000    28.55185   851.00000    10.00000    97.00000  the first quantitative variable
y      20    41.05000    32.37035   821.00000     3.00000    98.00000  the second quantitative variable


                                           Pearson の相関係数, N = 20
                                       帰無仮説 Rho=0 に対する Prob > |r|

                                                                       x             y

                          x                                      1.00000      -0.08693
                          the first quantitative variable                       0.7155

                          y                                     -0.08693       1.00000
                          the second quantitative variable        0.7155


                               プロット : y*x.  凡例 : A = 1 OBS, B = 2 OBS, ...


      |
      |
  100 +
      |    A
      |
      |
t     |
h     |
e     |
      |    A
s  80 +                                            A
e     |
c     |                   A                                                                             A
o     |
n     |                                          A
d     |                            A
      |
q     |
u  60 +                    A
a     |
n     |                                                  A
t     |
i     |
t     |
a     |
t     |
i  40 +                                                                                                  A
v     |
e     |
      |
v     |
a     |
r     |
i     |
a  20 +                                A
b     |           A
l     |    A   A                                                                                        A
e     |
      |  A                                                            A
      |                                         A
      |                                          A
      |                                                      A
    0 +
      |
      ---+----------+----------+----------+----------+----------+----------+----------+----------+----------+--
        10         20         30         40         50         60         70         80         90         100

                                           the first quantitative variable

--- SAS の corr プロシジャによ定量2変数間の相関係数とその検定結果 ---

Eric's back icon

6.9.1.3 SAS プログラムの例

 平成28年度からは、つぎの2種類のプログラムの中の最初の SAS 無償バージョン用の プログラムを用いること。

(1) 平成28年度から導入された SAS 無償バージョン用のプログラム

*-------------------------------------------------------------------------*
|                                                       February 2, 2016  |
|                                                                         |
|   a sasprogram for computing the correlation coefficient and testing the|
|  null hypothesis about it.                                              |
|                                                                         |
*-------------------------------------------------------------------------*;
filename data '/folders/myfolders/data/corr_scatter.txt';
options ps=60;
data work;
  infile data;
  input ssno 2. (x y) (3.);
  label ssno='sample number'
	   x='the first quantitative variable'
           y='the second quantitative variable';
run;

  title 'correlation and test of the null hypothesis about it';
proc corr data=work;
  var x y;
run;

  title 'scatter diagram of the two variable, x, y';
proc plot data=work;
  plot y*x;
run;

--- 架空データを用いた、相関係数とその検定のためのプログラム (SAS 無償バー ジョン用)---

Eric's back icon

(2) 平成27年度まで導入されていた SAS バージョン 9.4 等でのプログラム

*-------------------------------------------------------------------------*
|                                                         March 27, 2004  |
|                                                                         |
|   a sasprogram for computing the correlation coefficient and testing the|
|  null hypothesis about it.                                              |
|                                                                         |
*-------------------------------------------------------------------------*;
filename data 'p:\data\corr_scatter.txt';
options ps=60;
data work;
  infile data;
  input ssno 2. (x y) (3.);
  label ssno='sample number'
	   x='the first quantitative variable'
           y='the second quantitative variable';
run;

  title 'correlation and test of the null hypothesis about it';
proc corr data=work;
  var x y;
run;

  title 'scatter diagram of the two variable, x, y';
proc plot data=work;
  plot y*x;
run;

--- 架空データを用いた、相関係数とその検定のためのプログラム ---

Eric's back icon

6.9.1.4 SAS による具体的手順

プログラムのダウンロード・コーナー (授業で指示する日の翌朝まではダウンロードできません)

Eric's abar10 icon

corr_scatter.sas

  1. TeraPad を起動し、授業中に実習した、自分の学籍に対応する10個 のデータを zドライブ -> My Documents -> SASUniversityEdition -> myfolders -> の下の data フォルダに入力し、corr_scatter.txt なる名前で保存する。 保存時に、うえのデータ例のところに書いたように、ファイ ルの種類を間違えないように注意せよ

  2. インターネットエクスプローラ (IE) を開き、千野のホームページの うえのダウンロードコーナーからプログラムを zドライブ -> My Documents -> SASUniversityEdition -> myfolders myfolders の 下の sasprog フォルダに保存する。

  3. デスクトップ画面から SASUniversity Edition を起動し、所定の手順に従い、 デスクトップ上に SAS Studio なる画面を表示させる。

  4. その後の手順については、春学期授業の最初に配布するウエブ操作に関する ファイルを参照のこと。

Eric's back icon

Eric's color bar icon

脚注

脚注1 : マイナス記号は、同一列内の数字 01 を同時マークせよ

Eric's color bar icon