pasu (Probability and Statistics Utilities) は確率と統計の基礎的な計算を行なうアプリケーション集です。 データ・ファイルの扱いにやや難があるので実務には向きませんが、 入門・学習用によいと思います。
(右図をクリックすると大きく表示します。)
作者: Kline Bentley さん
ホームページ:
http://geocities.com/SiliconValley/Network/6885/
バージョン: 2.2.0 (2001/03/07)
ライセンス: GPL
付属ドキュメント README を読む
Least Squares Fit でのプロットは
gnuplot を利用します。
インストールしたら、まず適当なディレクトリを作成して、
/usr/share/doc/pasu-2.20/sample
にあるサンプルデータ・ファイルをコピーしてください。
$ mkdir pasu $ cd pasu $ cp /usr/share/doc/pasu-2.20/sample/* .
起動は
$ pasu
です。
起動するとブルーの画面が現れます。画面の上でマウスの左(または右)ボタンで クリックするとメニューが出て来ます。
一番上の Back Ground のペンギンアイコンをクリックすると背景画面の選択メニューが出ますが、 これらの画像は今回の RPM には含まれていません。 作者の趣味らしく、星雲の写真が多いです。 興味のある方は、作者のホームページから gifs.tar.gz を get してください。
次の Document は 6 ページ分の dvi ファイルが
xdvi を使って表示されます。
このドキュメントは /usr/share/pasu/stat.dvi
です。
xdvi は LinuxMLD 5 では標準インストールされています。 MLD6 では Disc4 から tetex 一式をインストールしてください。
では、まず、データファイルが必要ない確率の計算から見てみましょう。
Normal Dist は正規分布の計算をします。 アイコンをクリックして現れる画面 (右図) で mean、variance、x を入力すると確率を計算します。「終了」ボタンはないので 閉じるにはウィンドウ右上の×ボタンをクリックします。
Std Normal Dist は、mean=0、variance=1 とした特別な場合です。
Binomial Dist はこんな感じ (下図) です。 パラメータを変更したら Run をクリックすると再計算します。
次は、統計をやってみましょう。統計計算にはデータファイルが必要ですが、 計算の種類ごとに対象とするファイル名は事実上固定になっています (変更はできますが、選択のダイアログがないので大変です)。
Least Squares Fit をクリックすると左図のオプション設定画面が
現れます。データファイル名は fit.d
が仮定されます。
ファイルの変更および編集は Raise Input File で (一応) できます。
Define Variables
はデータファイルの何カラム目のデータを使うかを指定します。
必要なパラメータを設定したら Run をクリックすると結果が表示されます (このページ先頭の図を見てください)。
計算結果(Results ウィンドウに表示される内容)はファイル
fit.m
(この名前は固定) に出力されています。
またプロット用のデータ fit.t
と
gnuplot 用の Plot Script ファイル
fit.p
が作られます。Plot using bg
の文字の部分をクリックすると gnuplot のグラフが出ます。
もうひとつ、Basic Statistics をやってみましょう。このメニューから
Paired Diff Variance までは、デフォルトのデータファイル名は
example
になっています。
Example Data File メニューで example
ファイルを編集できます。ただし、ここで別のファイルを Load/Save
しても他のメニューで使用するデータファイル名には反映しません
(つまり各メニューは連係していません)。
Basic Statistics をクリックするとファイル example
が調べられて、各カラムのデータ数、最小、最大、平均値、分散、標準偏差が
計算されます。ファイルの記述ではデータ欠損も許されます。
計算結果の表示の下に「send columns」と表示されていますから、column を トグルボタンで選択して Send Columns ボタンをクリックします。 すると選択したカラム (複数ならそれら全部) について再度データ数などが 計算されます。
(`c' for new columns) と表示されますが
対応するボタンは New Columns です。
次に「Class Size」、「Lower Limit」を設定して Send
ボタンをクリックするとヒストグラムが表示されます。
(`q' to quit) と表示されても Quit ボタンはないので
終了はウィンドウ右上の×ボタンをクリックしてください。
LinuxMLD 5,6 用の RPM
pasu-2.20-1_mlb1.i386.rpm (279,010 bytes)
をインストールします。
rpm コマンドでインストールするにはスーパーユーザになって
# rpm -i pasu-2.20-1_mlb1.i386.rpm
とします。
Gnome の GUI でインストールすることもできます。
pasu は、GUI は Tcl/Tk で、計算部分は (一部を除き) C プログラムで書かれています。もともとは、プログラムもデータファイルも すべて自分のディレクトリに置いて実行するようにできていますが、 それではちょっと不便なのでメディアラボで修正を加えています。
統計について Web 上の参考になるページを御紹介します。
統計学関連…何でも掲示板、 統計学自習ノート、用語辞典、多機能 WEB 計算機 など豊富な コンテンツがあります。
統計に関する詳細なリンク集です。
その他のアプリケーション
http://ibiblio.org/pub/Linux/science/lab/ などで入手できます。
本格的な統計解析ソフトに関しては、 XLISP-STAT および R のページを参照してください。