『因果推論の科学』　by　ジューディア・パール

因果推論の科学　　「なぜ？」の問いにどう答えるか
ジューディア・パール
ダナ・マッケンジー
松尾豊　監修・解説
夏目大　訳
文藝春秋
2022年9月10日　第１刷発行

2022年11月の日経新聞書評で紹介されていて、興味をもった。どうやら、600ページ近い大作らしい。金額はともかく、分厚い本は買ってしまうと、本棚を占拠するので、図書館で予約した。忘れたころに、順番が回ってきた。

本当に、分厚い。見た瞬間、これは、、、手ごわい。。。と思った。うん、手ごわかった。そして、結局貸出期間の2週間で、十分に読み込めたかというと、未消化な部分もたくさんある。でも、時間の問題だけでなく、内容の難易度が、熟読したからと言って理解できるわけではない、、という感じがした。結局、さら～～っと読み。でも、なるほど、確かに因果というのは、奥が深い・・・。面白い一冊だった。因果関係、相関関係、統計、確率、、、と聞いただけで足踏みしてしまう人には、さらっと読みがおすすめ。事例もふんだんに織り込まれているので、なんとなく、いわんとすることが伝わると思う。

著者のジュ―ディア・パールはコンピューター科学者、哲学者。人工知能への確率論的アプローチの導入と、ベイジアンネットワークの開発によって世界的な名声を獲得。構造モデルに基づく因果推論と反事実的推論の開発でも知られ、人工知能分野の巨人と呼ばれている。 2011年にはコンピュータサイエンスにおける最高の栄誉であるチューリング賞を受賞した。現在、カリフォルニア大学ロサンゼルス校コンピュータサイエンス学科教授。

もう一人のダナ・マッケンジーは、科学ライター、とのこと。おそらく、ほとんどがパール氏が書いて、編集を一緒にした、ってかんじだろうか。謝辞には、そのような話がでてきた。本書の内容に関する構想を、実際に本とすることができたのは、ダナのおかげだ、と。

本書の最後には、索引もついている。いくつもの専門用語や著者のつくった？略語が出てくるので、索引はありがたい。略語は、一般的なものなのかは、AI専門家ではない私にはよくわからないけれど、索引があるとわからなくなってもすぐに見返せるのでありがたい。

表紙の裏の説明には、
”チューリング賞受賞「人工知能の巨人」が史上最大の難問「なぜ？」の問題に挑む。
この商品が売れた理由は？
感染症が広まった原因は？
従来の統計学やデータ分析からだけではこの「なぜ？」という問いには答えられない。
しかし、「なぜ？」という問いに人工知能が答えられれば、人間のように考える「強い AI」を作ることができる。
統計やデータを超えた「因果関係」はいかにして得られるか。
そもそも私たち人間は、どのように「因果関係」を考えているか。
まずは3段の「因果のはしご」を登ってみよう。”
とある。

目次
はじめに
序章　「因果推論」という新し科学
第一章　因果のはしご
第二章　シューアル・ライトが起こした革命　　因果推論創世記
第三章　結果から原因へ　　ベイジアンネットワークの真価と限界
第四章　交絡（こうらく）を取り除く　　ランダム化比較試験と新しいパラダイム
第五章　タバコは肺がんの原因か？　喫煙論争の煙を吹き飛ばす
第六章　パラドックスの詰め合わせ　因果のレンズで世界を見る
第七章　介入　険しい山を登るための強力な道具一式
第八章　反事実　「こうであったかもしれない」世界を考える
第九章　媒介　　因果関係の背後にはどんな仕組みがあるのか
第十章　ビッグデータ、AI、ビッグクエスチョン

もともと、「なぜ？」を説明できることに興味があるので、「因果関係」を明確にするという事自体、私にはとても興味深い。そして、序章で著者が明言する、

「データは基本的に何も教えてくれない。」

という一言には、大きく同意する。そうなのだ、データとはそこにあるだけでは、何の価値もない。解析、分析して初めて意味あるものになる。その意味を見出すことが分析するということだ。科学の世界でも、経済の世界でもそうだろう。株価の数字羅列があっても、それだけでは意味がない。そのデータ変動、規則性などを分析・解析してこそ、そのデータが価値あるデータになる。

ビッグデータなんて解析できないと、どんどんゴミデータが溜まっていくようなものなのだ。。。。今は、様々なデータはデジタル化されるので、どんどん保存していくことは可能になっている。でも、時系列で積み上げられたデータも、宝のもち腐れになっていることはよくある。工場での生産性向上のため、溜めたデータが解析できずにただただメモリーを占拠していく、、、って痛いほど経験してきたから、よくわかる。

変数がいくつもあると、結果が一つであっても、何が原因だったのかがわからず途方に暮れる・・・。規則性を見出そうと一生懸命プロットして相関関係を見出そうとするけれど、あれを一定にすればこっちが変動し、、、なにが結果でなにが原因かすらわからなくなり、、、「複雑性」のせいだと諦めて、、、放り投げる・・・なんど、繰り返したことか。

読んでいて、もう一つ、当たり前ながら、そうか！と膝をうったのは、因果関係を客観的に納得できるように説明するには、そのための言葉が必要、ということ。そして、それを数式化できないかぎり、コンピューターには解析もできない。だから、

「因果ダイアグラムと表現する記号言語が必要。」なのだ。

そして、因果関係を用いて世界を理解しようとしているのは人間だけなのだと。
因果関係を理解するのに必要な能力は、３つの異なるレベルの認知能力を身につける必要があると著者はいう。見る、行動する、想像すること。つまり、これが「因果のはしご」だ。

1段目：関連付け
何ができるか＝見ること。観察すること。
　観察を行い、その結果になんらかの規則性を見出す。
　獲物をとる動物の段階。

2段目：介入
何ができるか＝行動する事。介入すること。
　Ｘをすればどうなるか？どのようにすればいいかを考えて、行動する。
　アスピリンを飲むことによって、頭痛をなおす人間。

3段目：反事実
何ができるか＝想像すること。過去を振り返ること。ものごとを理解すること。
　頭痛がなおったのはアスピリンのおかげなのかを考える。アスピリンを飲んでいなかったらどうなっていたのかを想像する。想像して次を考えるのが人間。

介入や、反事実が複雑になるほど、因果関係も複雑になる。それをなんとか解決しようとしてきたのが科学者だけれど、相関関係と因果関係を区別できない時代もあった。本書の中では、科学者がどのように因果関係を数式で示そうとしたかの歴史も語られている。因果関係なんていうものはなくて、全ては相関関係でしかない、と結論づけようとした時代もあったのだ。なるほど、、、。

国の一人当たりのチョコレート消費量とノーベル賞受賞者の数には相関関係がみられる、という例が引用されている。おもしろいけれど、これは因果関係ではない。。

あるいは、喫煙と肺がんの関係、コレラとその原因、戦場での負傷者の死亡率と止血帯の関係、壊血病とビタミンCの関係などなど、かつては因果関係が明らかではなく、対応をあやまった悲劇もあった。因果関係を直感や物的証拠だけでなく、数式やダイアグラムで示せるようになるというのは、科学の革命だったのだ。

シューアル・ライトという人の、モルモットを使った毛色研究が紹介されている。モルモットの毛色は、遺伝だけでは決まらず、胎児のときの発生的要因も関係するのだそうだ。その関係性を図解しようとした。それは、パスダイアグラムと呼ばれている。これも、図をみてもらえれば、なるほど、、、の世界。
モルモットの毛色がどうきまるかということではなく、それを図解して見せたということが本書の中でのポイント。因果のはしごをのぼったのだ。図を見ると、確かに、複合要因で毛色がきまるのだということが想像つく。点と矢印でできた図だけれど、これが画期的なことだったのだ。

他にも本書の中に多くの図が挿入されているのだが、物事の関連性を点と矢印で示すことで、なにが原因で、なにが介入、あるいは交絡で、、、という関係性が示されている。言葉で説明するのは難しいのではぶいてしまうが、読みながら図と見比べると、原因と結果の関係性など、シンプルに図式化できれば、コンピューターに計算させることも可能になっていくのだろう、ということが想像つく。

シューアル・ライトが関係性を図解したことで、客観性の追求がはじまったが、後にまた大きなイベントが起こる。ベイズ理論だ。

ベイズ理論は、以前に『人はどこまで合理的か』でも紹介したことがあるが、尤度比（ゆうどひ）をあつかった確率の理論。

megureca.hatenablog.com

尤度比とは、ある確率分布が観察結果を説明するものとしてどの程度もっともらしいかを示す尺度のこと。

本書の中でも、ピンカ―同様に、「乳がん診断」における、本当に乳がんである確率について説明されている。検診で陽性となったとしても、実際に乳がんである確率は、その地域の女性の乳がん罹患率を計算にいれると、ぐっと下がるということ。

ベイズ理論から派生するベイジアンネットワークは、コンピューターの確率計算に利用されている。好事例として、「ボナパルト」という、DNA解析の遺体身元確認に使われた話が紹介されていた。
＊ベイジアンネットワーク：データの因果関係を分析する手法の1つで、因果関係の強さを、ある事象が起こった場合に他の事象が起こる確率である「条件付き確率」の大きさから判断し、多数の事象間の因果関係をグラフィカルに整理する方法。

「ボナパルト」は、最新の事故災害被害者特定ソフトウエアで、2014年マレーシア航空機がロシア製地対空ミサイルによって撃墜された際、身元確認で活躍したのだそうだ。理論的には、DNA解析から遺体身元を確定することはできるだろうけれど、それをそれなりの速度と精度で実施するには、ベイジアンネットワークにもとづく計算が有効だったということ。

また、モンティホールのパラドックスでも、『人はどこまで合理的か』と同様に「マリリンにきく」、の事例がでている。3つの扉からアタリを獲得するためには、1つ目の扉が外れであることが分かった後に、選択肢をかえるかどうか、ってやつ。これも、直観的には、選択肢をかえなくても同じ確率と思いがちだが、そうではないのだ。

長くなってしまうので、内容の覚書はこれくらいにしておこう。

様々な事例を紹介しつつ、因果関係を数式化することで、最終的には強いAI、人のように考えて判断する事ができるAIは、いつか作れるだろう、というのが著者の主張。そして、道徳心をもったロボットもいつかできるのだろう、、と。

因果関係を数式化する面白さは、興味深い。一方で、AIが物事を判断する世界は、やはり来なくてもいいのでは、、と思ってしまう。AIが判断材料を人に提供するのはいい。でも、世の中には白黒つかない、計算では答えが出ないことがたくさんある。最終判断は、人間、っていうのがいいと思うけどなぁ。あ、自動車の自動運転は、全てコンピューターでよいけど、ね。

なぜ？とその答えに興味のある人にはお薦めの一冊。

答えはないけれど、AIの可能性は広がっている。

読書は楽しい！