機械学習を解釈する技術 〜予測力と説明力を両立する実践テクニック 及び 施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方 を著者、出版社のご厚意により頂きました。ありがとうございます。隅々まで熟読できているわけではありませんが、感想を共有します。
機械学習を解釈する技術 〜予測力と説明力を両立する実践テクニック
近年、注目を浴びている説明可能 AI について解説している書籍です。ここで紹介される手法は、「モデルのデバッグ」「モデルの振る舞いを解釈」「因果関係の探索」に活用することができます。モデルのデバッグでは、機械学習が構築したモデルが事前知識と整合的な挙動をしているかを検討することを指します。例えば、小学生の 50m 走を分析した場合、背が高くなるほどタイムが縮むことが一般的です。タイムを予測するモデルを構築した時に、身長がタイムに好影響を与えているかどうかを確認することで、想定外のモデルを構築していないかをデバッグすることができます。モデルの振る舞いを解釈では、特徴量の変化が予測結果に与える度合いを見ることを指します。ただし、一般的に予測モデルは非常に複雑なため、解釈ではモデルの一側面のみしか反映できない可能性があります。因果関係の探索では、モデルの振る舞いを因果関係として解釈しますが、因果関係の仮説を作るところまでに留めておくことをオススメされています。より厳密に調査する場合は因果推論の手法と合わせて使う方が良いです。
実務で活用しやすい手法として、PFI (Permutation Feature Importance)、PD ( Partial Dependence)、ICE (Individual Conditional Expectation)、SHAP (SHapley Additive exPlanations)が紹介されています。これらの手法は、利用する予測モデルに制限されない手法であり、マクロな視点でみるかミクロな視点でみるかで使い分けが明確です。解釈可能の手法は特定のモデルでしか使えないものも多いですが、本書で解説されている手法は汎用性が高いため、本番で稼働しているモデルに対しても活用できます。
それぞれの手法が具体例やコードと共に解説されているので、説明可能 AI を初めて学ぶ人にオススメできる一冊です。
施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方
機械学習を既に実務で何度も投入した経験がある人向けの本です。機械学習や機械学習を用いたビジネスについて学びたい読者は、書籍内で紹介されている本を先に読むのをオススメします。機械学習実践のためのフレームワーク(KPI を設定する → データの観測構造をモデル化する → 解くべき問題を特定する → 観測データのみを用いて問題を解く方法を考える → 機械学習モデルを学習する → 施策を導入する)が提案されており、フレームワークに沿って解説されています。
業務で予測モデルを構築するケースを具体的な例を用いて紹介されており、その際に陥りがちな誤りを前半で解説しています。会員制のサービスで非会員ユーザーのデモグラを会員ユーザーのデモグラを用いて予測する例が紹介されています。会員の多くが若い人になるようなサービスの場合、これらのデモグラ情報を用いて非会員に対して予測をしてしまうと、バイアスのある結果になってしまいます。なぜなら、会員と非会員ではデモグラの分布が異なるためです。そのため、単に予測モデルを構築しただけでは、既存の会員の傾向をそのまま非会員に当てはめてしまっていることになります。このバイアスを取り除くためには、予測モデルをいかに構築すれば良いかを解説しています。
他にも、実際の具体例に基づいて、陥りがちな問題と原因、対策を一つずつ解説しています。経験がある人ほど緊張感を持って読むことが出来るかと思います。この本を読んだあとは、これまでに投入した機械学習に問題があるのではないかとヒヤヒヤするのではないかと思います。