このページは、平成11年6月8日に開設した。
このページは、令和2年5月8日に一部更新した。
第1節 sas プログラムの2つのステップ
一般に手持ちのデータをsas等のアプリケーションソフトで分析するためには、 最低2つのステップが必要である。 1つは、当該アプリケーションソフトの約束に 従って、データがどのような形で外部ファイル等に入っているのか、さらにそれらの データの各々にどのような名前を付けるのかを指示することである。他方は、その ようにして名前を付けられたデータに対して、どのような処理を行うのかをやは り当該ソフトの約束に従って指示することである。
sasでは、主として前者の役割をになうステップのことを data ステップ、後者の役割をになうステップを proc ステップと呼ぶ。もちろんこれら2つのステップを明確に区別するこ とはできない。というのは、dataステップでも、データの命 名等だけでなく、いろいろな種類の加工が可能であるからである。言い換えれば、 データの分析という言葉を広い意味でデータの加工と考えるならば、 dataステップ もprocステップもデータの加工のためのステップと考えることができるので、その 区別は意味のないことになる。
それではこれら2つのステップの大きな違いは何かといえば、データの加工とい う点では、前者はよりプリミティブな加工を、後者は既に確立された統計学的な 方法による加工を施すためのステップであると言えよう。
いずれにせよ、dataステップは、処理したいデータをsasプログラムが理解でき る言葉で(これはsasデータセットと呼ばれ、以降 sas/dsと略す)用意するためのものである。
従って、sasプログラムは、これら2つのステップを組合せることにより構成される。 sasの2つのステップを組合せることにより、いろいろな形のsasプログラムの作成 が可能なことがわかる。
つぎの節で述べるように、sas/dsには一時 sas/ds と永久sas/dsの2種類があり、前者は sas セッショ ンが終ると消えてしまうデータセットであるのに対して、後者はセッションが終了し ても外部ファイルに残るデータセットである。
どのような型のsasプログラムにするべきかは、どのような分析を行うかに依存 するので一概には言えないが、例えば心理学科の学生が卒論等の論文作成のため にsasを利用する場合には、もとのデータに対して実行の度にデータの初期加工 をdataステップで行うのではなく、データを一旦永久 sas/dsとして保存しておき、 いろいろな角度から複数の proc ステップでもって、多変量解析を行うこと が多いであろう。
心理学的データでは、もとのデータを安易に初期加工してしまうことは、後続の 多変量解析の前提条件を犯す危険もあるし、結果の解釈も複雑になる可能性があ るからである。しかし、一般のユーザの場合には、必ずしもこの方法がベストとは言 えないので、sasプログラム作成に際しては、分析目的とデータの性質をよく吟味 する必要があろう。
sasプログラムは、このようにして基本的には2つのステップから成るが、それぞ れのステップは、sas特有のsasステートメントを組合せて作成される。