長沼伸一郎氏の確率・統計編を読んだ。

いままで何冊も確率・統計の本を読んできたが、腹に落ちていないのか時間がたつとすぐに忘れてしまうことが多かった。

この本では、確率論とは誤差を見積もるところから始まった理論である、というところから始まっている。

その誤差とは以下の特徴をもっている。

1.誤差の本質は2つ。バイアス(一方方向にでる誤差)とゆらぎ(+とーの両方でる誤差)

バイアスのかけかたでいろんな形の分布が生まれる。ただし、どんな分布でもゆらぎ的な要素はのこる。それが正規分布。

2.誤差は多段構造式でうまれる。

上から玉をたくさん落として、たまった玉の分布が正規分布。

この本では終始、上記2点をベースにして、確率論を説明している。

パチンコ台のモデル


「誤差は多段構造式でうまれる」は、パチンコ台をイメージすると捉えやすい。



この本の内容の多くも、このパチンコ台のモデルに立ち返るとすっきりする。

たとえば、バイアスがかかるとは、パチンコの釘がある一定方向に向いている場合とも考えられる。
また、分布の広がりが大きくなるとは、釘の段数が多いとも考えられる。

最小二乗法、中央極限定理、ランダムウォーク


確率統計で重要なトピックである

最小二乗法、
中央極限定理、
ランダムウォーク

も上記2つの視点でイメージすると以下のようになる。

最小二乗法

データは正規分布のばらつきをもっており、最小二乗法とはその正規分布の中心線を推定すること、というとらえ方をしている。

ちなみに、四乗とかではなく二乗がベスト、というのは、正規分布+最尤法で導かれる。

中央極限定理

世の中には多種多様な確率分布があるが、それらを全部集めて混ぜると正規分布になる、という定理。

これも、誤差の本質(分布の本質)は、バイアスとゆらぎととらえれば、たくさんの確率分布をまぜると、バイアスの部分はランダムなものの加算なので影響がなくなり、各分布が共通にもっている性質である揺らぎの部分のみが残る、という考え方ができる。

いろんな光を合成すると白色になるという話がアナロジーとしてあげられている。

ランダムウォーク

時刻とともに正規分布の幅(分散)が広がっていくこと。
幅の広がりが$\sqrt{t}$であることがのちのちポイントになってくる。
幅の広がりが$\sqrt{t}$であることを、二次元上で対象物がランダムに移動することによって半径がどう広がっていくか、で説明している。
パチコン台で考えみると、段数が$n$段の場合、分散は$np(1-p)$となり、段数が一段増える(=時間が+1すすむ)と、分布の幅(標準偏差)は$\sqrt{t}$で広がる。正確ではないだろうが、こんな解釈もできるのか。


閑話休題1


「様々な統計分布は正規分布のバリエーションで生まれる」
誤差が、バイアスとゆらぎの2つの要素でなりたっているととらえると、様々な確率分布は正規分布になんらかのバイアスを加えたもの、という考え方でとらえることができる。

二項分布とポアソン分布
二項分布とは、コイントスを繰り返して、表がでた回数の分布である。パチンコ台でモデル化すると、玉が釘の右に行く確率と左に行く確率とに極端な差がなく、かつ、釘の段数はそれほど多くないパチンコ台と考えることができる。このようなパチンコ台で、多くの玉を落としたとき、落ちてきた玉の場所の分布が二項分布になっている。



ポアソン分布とは、1回あたりでは非常に珍しくしか起こらない事象を、長い時間観察したときの分布であるため、釘に玉が落ちてきたときに左に行く確率が極端に大きく右に行く確率が極端に小さい釘で、かつ、釘の段数が多いパチンコ台と考えるとことができる。このようなパチンコ台で、多くの玉を落としたとき、左に行く確率が極端に大きいため、ほとんどの玉は左の端にたまる。

段数が少ないとほとんどの玉は一番左端にたまることになる。段数がある一定数より大きくなると、ようやく一番左端から少し右にシフトしたところにもたまるようになる。つまり、事象の発生が確認できることになる。





釘に玉が落ちてきたときに右に行く確率と左に行く確率とに極端な差がなく、釘の段数が多い場合、分布は正規分布になる。



発生確率の小ささと段数の多さ(試行回数の多さ)で、正規分布、二項分布、ポアソン分布と分布の形は変化する。

べき乗分布
べき乗分布も一定の規則性でバイアスをかける、という構造で分布のカーブが作られている。

ブラックショールズ方程式


価格は下がったり上がったりと変動するものだが、例えば、価格の変動幅の絶対値だけ得をするといった仕組みをつくることができれば、価格の上下変動によらず常に得をすることができる。

例えば、Xの価格に応じて変動する債権Aと債権Bがあるとする。Xの価格が上がった場合は、債権Aのほうが債権Bより価格の上がり幅が大きく、一方、Xの価格が下がった場合は、債権Bのほうが債権Aより価格の下がり幅が大きい、という関係性があるとする。

このような関係性がある場合、債権Aをかっておき、債権Bをうっておけば、Xの価格が上がろうが下がろうが、一定の利益を得られる。




価格が上がろうが下がろうが一定の利益をえることができるということは、ある利率をもった商品とみることができる。では、利率はどれくらいだろうか。それがわかれば、商品としての値付けができる。

$y=F(x)$の関係で値動きをする2つの商品のポートフォリオを考えることで、値段を規定する関係式を導いていく。

まず、$x$の動きをモデル化する。$x$は一定に動く部分(傾向)とランダムに動く部分(ゆらぎ)があると考えると以下のように表現できる。
\[x = A t + B w\]
微小時間での動きを考えると
\[dx = A dt + B dw\]
と表現できる。
それを、\[dy=F(dx)\]に代入すると
\[dy = F(Adt + Bdw)\]
となる。$F$をテイラー展開すると
\[dy = F^{\prime}(Adt + Bdw) + \frac{1}{2}F^{\prime\prime}(Adt + Bdw)^{2}\]
となり、「微小」な項を削除すると
\[dy = F^{\prime}Adt+ F^{\prime}Bdw + \frac{1}{2}F^{\prime\prime}B^{2} dw^{2}\]
となる。
ここで、ゆらぎ$dw$が$\sqrt{t}$に比例することをつかうと
\[dy = (F^{\prime}A + \frac{1}{2}F''B^{2})dt + F^{\prime}Bdw\]
とまとめられる。

$x$のゆらぎは$Bdw$であるので、この式は$x$がゆらぐと$y$は$F^{\prime}Bdw$だけゆらぐことを示している。つまり、$y$は、$x$のゆらぎに$F^{\prime}$だけかけた分だけゆらぐ、といえる。

したがって、$y$を1単位買って、$x$を$F^{\prime}$単位売れば、ちょうどゆらぎがキャンセルされて、
\[-F^{\prime}dx + dy = \frac{1}{2}F^{\prime\prime}B^{2} dt\]
となる。これは、$x$の価格が上がろうが下がろうが上記のポートフォリオで得られる利益(利率)をあらわしている。

したがって、利率が$r$である商品になるということは、商品の価格が $-F^{\prime} x + y$ であるため
\[(-F^{\prime} x + y)r = \frac{1}{2}F^{\prime\prime}B^{2} dt\]
という関係式が導ける。

ゆらぎの係数$B$は$x$の分散であるので、$B$を$xσ$と表現し、$y$を$F$にして式を整理すると
\[-rF^{\prime}x + rF = \frac{1}{2}F^{\prime\prime}x^{2}\sigma^{2} \]
という関係式が導かれる。

つまり、市場経済は、この式を満たす形で値段を決めているはず、ということになる。