Eric's color bar icon

under construction icon

このページは、平成11年6月8日に開設した。
このページは、令和2年5月8日に一部更新した。

付録 sas プログラムの作成

 第1節 sas プログラムの2つのステップ

 一般に手持ちのデータをsas等のアプリケーションソフトで分析するためには、 最低2つのステップが必要である。 1つは、当該アプリケーションソフトの約束に 従って、データがどのような形で外部ファイル等に入っているのか、さらにそれらの データの各々にどのような名前を付けるのかを指示することである。他方は、その ようにして名前を付けられたデータに対して、どのような処理を行うのかをやは り当該ソフトの約束に従って指示することである。

 sasでは、主として前者の役割をになうステップのことを data ステップ、後者の役割をになうステップを proc ステップと呼ぶ。もちろんこれら2つのステップを明確に区別するこ とはできない。というのは、dataステップでも、データの命 名等だけでなく、いろいろな種類の加工が可能であるからである。言い換えれば、 データの分析という言葉を広い意味でデータの加工と考えるならば、 dataステップ もprocステップもデータの加工のためのステップと考えることができるので、その 区別は意味のないことになる。

 それではこれら2つのステップの大きな違いは何かといえば、データの加工とい う点では、前者はよりプリミティブな加工を、後者は既に確立された統計学的な 方法による加工を施すためのステップであると言えよう。

 いずれにせよ、dataステップは、処理したいデータをsasプログラムが理解でき る言葉で(これはsasデータセットと呼ばれ、以降 sas/dsと略す)用意するためのものである。

 従って、sasプログラムは、これら2つのステップを組合せることにより構成される。 sasの2つのステップを組合せることにより、いろいろな形のsasプログラムの作成 が可能なことがわかる。

 つぎの節で述べるように、sas/dsには一時 sas/ds永久sas/dsの2種類があり、前者は sas セッショ ンが終ると消えてしまうデータセットであるのに対して、後者はセッションが終了し ても外部ファイルに残るデータセットである。

 どのような型のsasプログラムにするべきかは、どのような分析を行うかに依存 するので一概には言えないが、例えば心理学科の学生が卒論等の論文作成のため にsasを利用する場合には、もとのデータに対して実行の度にデータの初期加工 をdataステップで行うのではなく、データを一旦永久 sas/dsとして保存しておき、 いろいろな角度から複数の proc ステップでもって、多変量解析を行うこと が多いであろう。

 心理学的データでは、もとのデータを安易に初期加工してしまうことは、後続の 多変量解析の前提条件を犯す危険もあるし、結果の解釈も複雑になる可能性があ るからである。しかし、一般のユーザの場合には、必ずしもこの方法がベストとは言 えないので、sasプログラム作成に際しては、分析目的とデータの性質をよく吟味 する必要があろう。

 sasプログラムは、このようにして基本的には2つのステップから成るが、それぞ れのステップは、sas特有のsasステートメントを組合せて作成される。

Eric's color bar icon