モンティ・ホール問題は,10年以上前,確率の授業ではいつも紹介していた.最近は数学Bしか教えていないので,忘れかけていて,答えは知っていたが理屈をちょっと考えてしまった.すぐに思い出したけど.
この番組で,数学的なことが扱われることは,珍しい.
説明すれば簡単なのだけれど,言葉で説明されても,納得できない人のために,中学校で実際に実験した様子がよかった.
92人の生徒を半分に分けて,一方は変える,他方は変えないで,1人が4回勝負.
実験結果
変えたほうが123勝,変えないほうは72勝.
変える | 変えない | |||||||
変える | 変えない | 合計 | 勝ち | 負け | 勝ち | 負け | ||
4勝0敗 | 13 | 1 | 14 | 52 | 0 | 4 | 0 | |
3勝1敗 | 15 | 5 | 20 | 45 | 15 | 15 | 5 | |
2勝2敗 | 9 | 16 | 25 | 18 | 18 | 32 | 32 | |
1勝3敗 | 8 | 21 | 29 | 8 | 24 | 21 | 63 | |
0勝4敗 | 1 | 3 | 4 | 0 | 4 | 0 | 12 | |
合計 | 46 | 46 | 92 | 123 | 61 | 72 | 112 |
それと,マンモグラフィーの数字が面白かった.
集団検診で,がんで無い人が要精検という判定が出るのは 9%.
要精検と出た人のうち,がんの人は 3%.
この数字はどちらも正しいというもの.理屈を知ればあたりまえ.
乳がんの確率は1000人に3人程度.がんでない997人のうち,要精検という判定が出るのは90人くらい.つまり 90÷997 = 0.09 = 9%.
「がんで無い人が要精検という判定が出るのは 9%」というと,がんの人が 91% という印象を持ってしまう.「健康な人のうち」ということ.これが数字のトリック.
つまり「0.3%のがんの人を見つけるために,もれなく全員検診を受けて欲しい」という数字なのかもしれない.
要精検と出た人93人のうち,がんの人は3人なので,3÷93=0.032=3.2%.
これで思い出した問題が,
ある病気にかかる人は1000人に1人.というものがある.これも,陽性が出たら,絶望的な気がするけれど.1割にもならない.
その病気にかかっている人が検査で陽性になる確率は98%.
かかっていない人が検査で陰性になる確率は99%.
この検査で,陽性になっている人の何%が,病気にかかっているか?
答え 8.9%
なぜなら,1000000人中,病気の人は1000人.
病気にかかった1000人のうち,検査で陽性になるのは980人.
かかっていない999000人のうち,検査で陽性になるのは1% の9990人.
陽性になる9990+980=10970人のうち,病気の人は 980÷10970 = 0.0893 = 8.93%
あと,サンプルの偏りの話題(顧客満足度99%)とか,アンケートの設問の設定でバイアスがかかる話とか.
以前,文科省の研究指定のからみで,卒業生に郵送アンケートを取ったことがあった.つまりそれは全数調査ではなく,「アンケートに協力した人だけが母集団の調査」である.これがサンプルの偏り.
もっと身近な例では,自分の狭い範囲の体験やうわさだけで,ある集団(性別だったり年齢差だったり人種だったり血液型だったり学歴だったり)にレッテルを貼る行為なんかは,サンプルの偏りだよね.
数学が専門なので,こういう話題は,大好き.
アンケート結果や世論調査は,全数調査ではないことを常に意識すべきだと思っている.信じるとか信じないとかということではなく,「その調査ではそういう結果が出た」という「データの一つ」である.
「信じるか?」といわれれば,「鵜呑みにはしない」.「信じないのか?」といわれれば,「その調査対象の傾向として,は信じられる.」.
来年4月から始まる高校の新教育課程.全員必修の数学Iに「データの分析」が入ってくる.
事実を並べるほど,客観的になるから輪郭があいまいになり,噂話ほど断定的なので本当らしいものはない.
2012年7月2日追記>「モンティ・ホール問題 」
0 件のコメント:
コメントを投稿
スパム対策のため,コメントは,承認するまで表示されません。
「コメントの記入者:」は「匿名」ではなく,「名前/URL」を選んで,なにかニックネームを入れてください.URL は空欄で構いません.