小島寛之『使える!確率的思考』

使える!確率的思考 (ちくま新書)

使える!確率的思考 (ちくま新書)


確率、大嫌いでした。全然計算式の意味が分からなくて、毎回すべてのケースを樹形図で書いて、何通りかを数えてテストに回答していました。当時は、「こんなもん役に立たない」と思っていましたけど、全然そんなことない。仕事をするようになって、えらく確率的な部分とか見通し的な部分とかってつかわなきゃならないのですから。そんな意味で、筆者の以下の意見にすごく同意。

この本は、「学校の確率ができるようになる」ためには、きっと役に立たないだろう。でも、よく考えてほしい。あなたが大人なら、どうしていまさら「学校の確率ができるようになる」ことが必要なのだろう。だって、あなたが毎日通っているのは、学校ではなく実社会なのだ。たとえていうなら、学校の給食で、ある食材が嫌いになった大人が、もう一度教室に出向いて給食を食べて、それを克服しようとしているようなものではないか。それはどう考えたってばかげている。大人には、大人の分別と教養とお金と味覚がある。大人には大人のやり方があるじゃないか。
断言しよう。学校で教わる確率の大部分は、受験にしか役に立たない。人生でそれ以外に使える場面は皆無だといっていい(もちろん受験は、人生の重要なステップだ。だからあなたがこれから受験を迎える人なら、どうにか確率嫌いを克服しなければならない)。でも、学校では教わらなかった「確率的なものの見方・考え方」は、人生を生きる中ですごく役に立つのだ。一生もので使えるのだ。(p.10)

小島さんの言っていることは、例がすごくわかりやすいこともあるけど、いろいろと考えるとっかかりとしていい。こういう事例をうまく使って、確率の話をすればいいのか、と勉強になりました。情報解析と確率と将来の見通し、みたいなものを組み合わせた授業をするときに使えそうかな、と思いました。小島先生の本は他にも当たってみようと思います。
以下、いろいろと細かいメモ。

p.79-80

「データに親しむ」ということは、簡単にいえば、「人間社会や自然環境に関心を持つ」ということである。世の中には、いろいろな固有現象がある。法則や特徴がある。しかし、社会や自然をそのまま「生」で眺めていても、「なにかあるな」ぐらいにしか直感できない。そこでまず、「数字に直す」という作業が重要なのだ。まさに「データ化」の作業である。次の段階は、それらの数字に潜む特徴を引き出すことである。これがいわゆる「データ解析」。その初歩ができるようになるだけでも、世の中を見る眼の解像度はずいぶん変わるし、解像度が高まれば、見ること自体が楽しくて仕方ない、という風になる。


p.83-84

確かに丙午の女児が少ないことがデータに現れてはいるが、よく考えてみれば、「男女の産み分け」というのは現実には不可能なはずである。だから、出生児童の中の女児だけが少なくなった、という推測は非現実的だ。では、どういうからくりなのだろう。
推測だが、たぶん戸籍の操作によったのだ。つまり、年の前半に生まれた女児は前年に生まれたと虚偽申告され、後半に生まれた女児は次年度に生まれたと虚偽申告されたに相違ない。
その証拠は、まさに前年度と次年度のデータにある。こういうところが、データ解析のエキサイティングなところである。両年において、男児出生比率は例年に比べて低下しているのが見てとれる。われわれの仮説はこれで支持されることになった。
われわれのこの仮説を端的に検証するには、「移動平均」というよく使われる統計テクニックが非常に有効である。移動平均というのは、時系列のデータにおいて、連続するいくつかのデータをひとまとめにして平均していくことである。たとえば、その年のデータとその前後の年のデータを平均した3期移動平均というものを、1906年のデータに対して実行してみよう。(0.507+0.521+0.507)/3=0.512となる。丙午の年の特異性は姿を消し、もとの安定した比率が現れるではないか。これは、その年の女児の出生がごまかされて、前後の年に振り分けられたことが打ち消されてしまったためである。前後の年もあわせて3で割れば、確かに例年と同じ出生比率が浮かび上がるのだ。
この移動平均という手法は、ある期間にだけ突出して現れたような特徴を打ち消すために利用される。


p.96-98
標準偏差の考え方を身につければ、統計学の大事な部分はおおよそ理解できる:
標準偏差とは、「平均からのブレ」
・いつもぴったり時刻表通りに到着するバス
・前後に等確率で2分ずれるバス
・前後に等確率で10分ずれるバス
どれも平均で見れば時刻表の時刻に到着するバスだが、使い勝手は全然違う。


p.136
統計的推定:
データがたくさんないと何もできない。データをたくさん得た後に、「Aタイプだ」「Bタイプだ」の一方を断言する。

ベイズ推定:
データが少なくても、あるいは全くデータがない段階でも推定ができる。そのかわり、推定は曖昧なものになり、「Aタイプ、Bタイプ、両方の可能性があるけど、どっちのが何倍くらいありそうだよ」という形式で答える。


p.177-179
マイケル・ロスチャイルド「2本腕のスロットマシン」
・「価格づけ」の問題がテーマ。
・価格を決めたとき、その価格に応じて、やってきた客がどれくらいの割合で買うか。価格を高くすれば10人に1人程度しか買わない。安くすれば、8割くらいの人が買ってくれるが、利益が少なくなる。
・価格に応じて何人の客が買ってくれるかの関数がわかれば、価格づけには悩まない。しかし、現実にはこの館数を事前に正確に知りようがない。

・こういう状況下で、商店主が正しい価格づけを探し当てられるかどうか、を問題にした。
・また、場合によっては、商品の値札を間違った不利な価格に固定し続けてしまう可能性を指摘した。

ここにある種の矛盾というか、相克というか、そういうものが生じる。大きな利益を得るためには、最適の価格に「固定」すべきである。しかし、最適の価格というのは、いろいろ価格を動かして客の購買行動を観察してはじめてわかってくるものである。価格を固定することは、最適な価格の「模索」を法規することになるし、価格を動かして最適な価格を模索することは最適でない価格水準での販売を続けることを意味する。


p.210

不確実性下の意志決定に際して問題になるのは、「合理的な選択」と「正しい選択」の違いである。とりわけ、「不確実性下における選択の正しさとはいったい何か」という点が大問題なのである。