映画、書評、ジャズなど

伊藤公一朗「データ分析の力 因果関係に迫る思考」

 

 日本でもビッグデータの重要性が唱えられて久しく、データ利活用の主導権を巡るグローバルな競争が益々激しくなっている印象ですが、他方で、データを一体どう使ったらよいのかという面については、実は十分に議論されていない感じもします。そうした中で、データを活用して因果関係を導くやり方を分かりやすく紹介する本書は、大きな気づきを与えてくれます。

 

データから因果関係を導くことは、実はそんな簡単なことではありません。その理由は、他の要因が影響していた可能性があること、逆の因果関係だった可能性があることが挙げられます。つまり、相関関係があるからといって、因果関係が導き出せるとは限らないわけです。

例えば、データ上は、寝ている時に電気をつけている子供ほど近視になっているのですが、これは相関関係としては正しいわけですが、電気をつけたまま寝かせると子供が近視になるという因果関係があるわけではありません。なぜなら、近視を持つ親ほど寝るときに電気をつけていることが多く、近視の親を持つ子供ほど遺伝的に近視になりやすいからです。

では、どうすればこうした因果関係を導き出す難しさをクリアできるのか?それは、因果関係によって導き出された効果を「介入効果」を測定するため、介入を受けた「介入グループ」と介入を受けない「比較グループ」を比較するやり方です。この比較をするやり方として、「ランダム化比較試験(RCT)」があります。これは、グループ分けをランダム(無作為)に行うやり方です。実際、オバマ前大統領の選挙活動では、元グーグルのシローカー氏がこの手法を使ってウェブサイトのデザインを決め、支援者からの資金獲得につなげたのだそうです。

このRCTの手法は、透明性が高いという利点がありますが、実施に当たって費用・労力・各機関の協力が必要となるという弱点もあります。

一方、「RDデザイン」という、境界線に着目した分析手法があります。これは、例えば、医療費自己負担制度に着目した分析で、70歳を境に医療費の自己負担が3割から1割に減少するという点に着目し、外来患者数を分析することで、70歳という境界線において、非連続に外来患者数が増加していることが確認できます。この場合、他の要素が70歳という境界線において非連続にジャンプしていない限り、医療費の自己負担額と医療サービス利用の間に因果関係が見出せることになります。

さらに、階段状の変化を用いた「集積分析」という手法もあります。例えば、自動車の燃費規制は、車のサイズが大きくなるほど緩くなっているわけですが、こうした燃費規制がどのような影響を与えているかについて分析する際に、規制が変わるポイントでは、自動車の重量をあえて重くするような集積が生じていることが確認できます。これを分析すると、燃費規制が自動車の重量化をもたらしていることが確認できます。

複数期間のデータを生かす「パネル・データ分析」という手法もあります。複数のグループに対し、複数期間のデータが手に入る場合、何らかの介入がなければ、両者のトレンドが平行に推移すると仮定できる場合(平行トレンドの仮定)、実際に生じた差を介入効果として捉えることができます。

 

本書では、以上のような様々な分析手法が、素人にも分かりやすく紹介されています。著者によれば、シリコンバレーでは、日常的にRCTを使ったビジネス戦略分析が行われているそうです。米国政府も、エビデンスに基づく政策形成が提唱されています。

現に、米国企業のウーバーでは、消費者のデータに基づき需要曲線を作ることで、消費者価格変化にどのように反応するかを分析しているとのこと。

他方、日本ではこうしたデータを生かす取組みが十分とは言えないでしょう。

著者は、データ分析に基づく意思決定を進めるための成功の鍵として、まずデータ分析専門家との協力関係を築くことを提唱しています。それから、データへのアクセスを開くことです。その方法としては、データを全ての人に公開するやり方や、所定の手続きを踏めばアクセスできる仕組みを整えるやり方、信頼できる専門家だけに門を開くやり方、いろいろあります。

 

もちろんデータ分析が万能であるわけではありませんが、日本では政府も企業ももう少しデータの重要性を認識する必要があるように思います。データ利活用という言葉だけが何か空回りしているのは、それがどう使えるかについて十分な認識がないからだと思います。

データはAI機械学習にとって重要であることが盛んに言われていますが、その活用が広がっていくためには、データ分析によってどう因果関係が導かれるかを理解することは不可欠でしょう。

データの重要性に対する意識を喚起する上で、本書は大変貴重だと思います。

 

以下、著者が電力マーケットの分析について述べている動画を参考までにリンクしておきます。


電力のマーケット・デザイン(Market Design for Electricity)シカゴ大学准教授 伊藤公一朗