pasu

pasu

pasu (Probability and Statistics Utilities) は確率と統計の基礎的な計算を行なうアプリケーション集です。 データ・ファイルの扱いにやや難があるので実務には向きませんが、 入門・学習用によいと思います。

(右図をクリックすると大きく表示します。)

作者: Kline Bentley さん
ホームページ: http://geocities.com/SiliconValley/Network/6885/
バージョン: 2.2.0 (2001/03/07)
ライセンス: GPL
付属ドキュメント README を読む

Least Squares Fit でのプロットは gnuplot を利用します。

使い方

インストールしたら、まず適当なディレクトリを作成して、 /usr/share/doc/pasu-2.20/sample にあるサンプルデータ・ファイルをコピーしてください。

$ mkdir pasu
$ cd pasu
$ cp /usr/share/doc/pasu-2.20/sample/* .

起動は

$ pasu

です。

Menu 起動するとブルーの画面が現れます。画面の上でマウスの左(または右)ボタンで クリックするとメニューが出て来ます。

一番上の Back Ground のペンギンアイコンをクリックすると背景画面の選択メニューが出ますが、 これらの画像は今回の RPM には含まれていません。 作者の趣味らしく、星雲の写真が多いです。 興味のある方は、作者のホームページから gifs.tar.gz を get してください。

次の Document は 6 ページ分の dvi ファイルが xdvi を使って表示されます。 このドキュメントは /usr/share/pasu/stat.dvi です。

xdvi は LinuxMLD 5 では標準インストールされています。 MLD6 では Disc4 から tetex 一式をインストールしてください。

では、まず、データファイルが必要ない確率の計算から見てみましょう。

Normal Dist は正規分布の計算をします。 アイコンをクリックして現れる画面 (右図) で mean、variance、x を入力すると確率を計算します。「終了」ボタンはないので 閉じるにはウィンドウ右上の×ボタンをクリックします。

Std Normal Dist は、mean=0、variance=1 とした特別な場合です。

Binomial Dist はこんな感じ (下図) です。 パラメータを変更したら Run をクリックすると再計算します。

次は、統計をやってみましょう。統計計算にはデータファイルが必要ですが、 計算の種類ごとに対象とするファイル名は事実上固定になっています (変更はできますが、選択のダイアログがないので大変です)。

LS options Least Squares Fit をクリックすると左図のオプション設定画面が 現れます。データファイル名は fit.d が仮定されます。 ファイルの変更および編集は Raise Input File で (一応) できます。 Define Variables はデータファイルの何カラム目のデータを使うかを指定します。

必要なパラメータを設定したら Run をクリックすると結果が表示されます (このページ先頭の図を見てください)。

計算結果(Results ウィンドウに表示される内容)はファイル fit.m (この名前は固定) に出力されています。 またプロット用のデータ fit.tgnuplot 用の Plot Script ファイル fit.p が作られます。Plot using bg の文字の部分をクリックすると gnuplot のグラフが出ます。


もうひとつ、Basic Statistics をやってみましょう。このメニューから Paired Diff Variance までは、デフォルトのデータファイル名は example になっています。 Example Data File メニューで example ファイルを編集できます。ただし、ここで別のファイルを Load/Save しても他のメニューで使用するデータファイル名には反映しません (つまり各メニューは連係していません)。

Basic Statistics をクリックするとファイル example が調べられて、各カラムのデータ数、最小、最大、平均値、分散、標準偏差が 計算されます。ファイルの記述ではデータ欠損も許されます。

計算結果の表示の下に「send columns」と表示されていますから、column を トグルボタンで選択して Send Columns ボタンをクリックします。 すると選択したカラム (複数ならそれら全部) について再度データ数などが 計算されます。

(`c' for new columns) と表示されますが 対応するボタンは New Columns です。

次に「Class Size」、「Lower Limit」を設定して Send ボタンをクリックするとヒストグラムが表示されます。 (`q' to quit) と表示されても Quit ボタンはないので 終了はウィンドウ右上の×ボタンをクリックしてください。

インストール

LinuxMLD 5,6 用の RPM pasu-2.20-1_mlb1.i386.rpm (279,010 bytes) をインストールします。
rpm コマンドでインストールするにはスーパーユーザになって

# rpm -i pasu-2.20-1_mlb1.i386.rpm

とします。
Gnome の GUI でインストールすることもできます。

その他

pasu は、GUI は Tcl/Tk で、計算部分は (一部を除き) C プログラムで書かれています。もともとは、プログラムもデータファイルも すべて自分のディレクトリに置いて実行するようにできていますが、 それではちょっと不便なのでメディアラボで修正を加えています。

参考

統計について Web 上の参考になるページを御紹介します。

その他のアプリケーション

本格的な統計解析ソフトに関しては、 XLISP-STAT および R のページを参照してください。

[2001/03/19 作成] [2002/03/25 更新]


このページに関する御意見、御要望を science@mlb.co.jp までお寄せ下さい
Copyright © 2001-2005 Media Lab. All Rights Reserved.