AI創薬のSHAP完全ガイド｜MolSHAP・EdgeSHAPerで予測根拠を可視化

AI創薬の現場では、機械学習モデルが化合物の活性・物性・ADMET特性を高精度に予測できるようになりました。一方で、「なぜそう予測したのか」が見えないブラックボックス問題は依然として大きな課題です。FDAやEMAなどの規制当局は、AI/ML利用に関して透明性・文書化・使用文脈に応じた信頼性評価・リスク管理を重視しており、説明可能性（XAI）は実務上重要な評価観点となっています。ただし、SHAPなどの特定のXAI手法が一律に必須化されているわけではない点には留意が必要です。

そこで本記事では、AI創薬で広く用いられている代表的なXAI手法の一つであるSHAP（SHapley Additive exPlanations）を取り上げます。理論的な背景から、MolSHAPやEdgeSHAPerといった創薬・分子グラフ解釈に特化した派生的手法、Pythonでの実装、注意点までを医療関係者向けに分かりやすく解説していきます。

２．SHAPとは？ゲーム理論に基づく解釈可能性手法

SHAPは、機械学習モデルの予測結果を「各特徴量がどれだけ貢献したか」に分解して説明する代表的な手法です。基盤となるのは、1953年にロイド・シャープレイ（Lloyd Shapley）が協力ゲーム理論で提唱したシャープレイ値（Shapley value）です。複数のプレイヤーが協力して得た成果を、各プレイヤーの貢献度に応じて公平に分配する数学的な枠組みです。

機械学習に適用する際は、各特徴量を「プレイヤー」、モデルの予測値を「成果（ペイオフ）」とみなします。すべての可能な特徴量の組み合わせを考慮し、特定の特徴量が加わったときに予測値がどれだけ変化したか（限界貢献度）の加重平均を取ることで、SHAP値が算出されます。

３．Shapley値の代表的性質とSHAPの設計指針

SHAPが理論的に堅牢とされる背景には、協力ゲーム理論におけるシャープレイ値の代表的な4つの性質があります。

効率性（Efficiency）：すべての特徴量のSHAP値の合計が、予測値と平均予測値の差に一致する
対称性（Symmetry）：すべての連合で同じ貢献をする2つの特徴量は同じSHAP値を持つ
ダミープレイヤー（Dummy Player）：どの連合でも貢献しない特徴量のSHAP値は0になる
線形性（Linearity）：2つのモデルを足し合わせたモデルのSHAP値は、各モデルのSHAP値の和に等しい

SHAPを機械学習の説明手法として提案したLundberg & Leeの論文では、これらの性質に対応する形でlocal accuracy（局所精度）・missingness（欠損特徴量の扱い）・consistency（一貫性）という設計指針も整理されています。Shapley値の数学的公理とSHAP特有の設計指針は別の文脈で語られることが多いため、両者を分けて理解しておくと混乱が少なくなります。

４．AI創薬でSHAPが注目される理由

創薬の現場でSHAPが活用される背景には、単にモデルを「見える化」するだけでなく、研究プロセスでの判断材料を増やせるという実務的な利点があります。具体的には次のような価値が挙げられます。

透明性の向上：FDAやEMAのAI/ML関連文書では、透明性・文書化・信頼性評価が重視されており、SHAPはその一手段となり得る
科学的妥当性の補助的検証：化学的常識と整合する特徴に基づいて予測しているかを確認する補助となる
化合物設計の議論材料：活性に寄与すると推定される部分構造を可視化し、構造最適化の議論を促す
信頼性評価の補助：誤分類されやすい化合物を検出し、信頼性評価のヒントを与える

なお、SHAP単独で規制対応や安全性確認が完結するわけではありません。最終的な評価には実験データ、非臨床・臨床評価、専門家判断が必須です。

５．SHAPの具体的な応用例

5.1. 分子フィンガープリント分析

創薬では、分子をMorganフィンガープリント（ECFP4）・MACCSキー・RDKit記述子などの数値表現に変換してモデルに入力します。SHAPはこれらの特徴量がどれだけ予測に寄与したかを定量化できます。ある研究では、ECFP4で約400ビット、MACCSキーで約20個、RDKit記述子で45〜125個程度を使うと累積寄与率90%に達したと報告されていますが、これは特定のデータセット・モデルに依存する結果であり、一般法則ではありません。

5.2. MolSHAP：R基ベースのQSAR解釈

MolSHAP（ACS JCIM 2024, 64(7), 2236-2249）は、QSAR解析、とくにR-groupベースの化合物系列解釈に焦点を当てた解釈フレームワークです。従来のSHAPが個別の特徴量に寄与を割り当てるのに対し、MolSHAPはR基（R-groups）フラグメント単位で活性への寄与を推定します。創薬化学者が日常的に行うフラグメント単位の改変と直接対応する解釈が可能となり、化合物最適化アルゴリズムへの応用も報告されています。

5.3. EdgeSHAPer：GNNの結合中心の重要度推定

分子をグラフとして扱うグラフニューラルネットワーク（GNN）の解釈には、EdgeSHAPer（iScience 2022）が利用できます。原子（ノード）ではなく化学結合（エッジ）の重要度をShapley値で推定する手法で、モンテカルロサンプリングによって計算コストを抑えます。重要と推定されたエッジは「モデル予測に寄与した可能性のある結合」を示しますが、薬理作用や結合様式を直接証明するものではない点には注意が必要です。実装はGPL-3.0で公開されています。

5.4. ADMET予測の解釈

ADMET（吸収・分布・代謝・排泄・毒性）予測においても、SHAPはモデルの挙動を把握する補助として活用できます。分子量・極性表面積・水素結合供与体数などのモデル内での寄与を可視化したり、代謝安定性や毒性予測において構造アラート候補となる部分構造を示唆したりできます。ただしこれらはモデル予測の解釈であり、安全性や薬物動態特性を実験的に確認したことを意味しません。最終的な評価には実験的検証・非臨床試験・臨床評価・専門家判断が不可欠です。

６．SHAPの主要な可視化手法

SHAP分析の結果は、目的に応じて以下のプロットで可視化されます。

バープロット：全サンプルの平均絶対SHAP値で、特徴量の全体的な重要度をランキング表示
ビースウォームプロット：SHAP値の分布と特徴量値の高低を同時に表示し、非線形性や交互作用の傾向を把握
散布図：特定の特徴量値とSHAP値の関係を可視化し、線形・非線形トレンドを確認
ウォーターフォールプロット：単一サンプル（特定の化合物）について、各特徴量が予測値をどう押し上げ／押し下げたかを段階的に表示

全体傾向の把握にはバープロットやビースウォームを、特定化合物の予測根拠の説明にはウォーターフォールプロットを使い分けるのが一般的です。

７．Python実装：3種類のExplainerの使い分け

PythonのSHAPライブラリには、モデルアーキテクチャに応じて選べる主要なExplainerクラスがあります。

TreeExplainer：XGBoost・LightGBM・CatBoost等の木ベースモデル向け。条件設定に応じて高速かつ厳密にTree SHAPを計算できる（特徴量依存性の仮定や出力形式により解釈は変化）
DeepExplainer：PyTorch・TensorFlow等のニューラルネットワーク向け。背景データセットを用いた効率的な近似計算
KernelExplainer：モデル非依存（model-agnostic）で任意のモデルに使えるが、計算コストは比較的高い

創薬で頻用されるXGBoost+ECFPの組み合わせならTreeExplainerが、GNNの場合はEdgeSHAPerのような特化手法が現実的な選択肢となります。

８．SHAPを使う上での注意点

SHAPは強力な解釈手法ですが、医療関係者が使う上で押さえておくべき重要な制約があります。

因果効果ではない：SHAPはモデル予測の寄与を説明する手法であり、化学構造と活性・毒性の因果関係を直接証明するものではありません
背景データ・特徴量相関の影響：SHAP値は背景データセットの選び方、特徴量間の相関、学習データの偏り、モデルの適用範囲（applicability domain）に影響を受けます。分子フィンガープリントや記述子は相関・冗長性が高いため、寄与の解釈には注意が必要です
モデル解釈≠化学的妥当性：SHAPで「モデルがどこを見ているか」は分かりますが、それが化学的・生物学的に正しいとは限りません。SAR、既知の構造アラート、ドメイン知識、実験データとの照合が必要です
分布外化合物への外挿に注意：学習データの分布から外れた化合物への解釈は信頼性が低下するため、適用範囲の評価とあわせて利用すべきです

９．創薬での実践的活用と規制動向

SHAPは、創薬パイプラインの中で透明性とモデル理解を支える代表的な手法の一つです。バーチャルスクリーニングでは、生データとSHAP値の両方を使って誤分類されやすい化合物にフラグを立てる手法も提案されており、ある研究では「RAW OR SHAP」ルールで誤分類の最大64%程度を特定できたと報告されています。

規制動向の面では、FDAの2025年ドラフトガイダンスやEMAのAIリフレクションペーパーで、AIモデルの使用文脈に応じた信頼性評価、透明性、文書化、リスク管理の重要性が示されています。ただし、いずれもSHAP等の特定のXAI手法を必須としているわけではありません。ICH Q8-Q12は医薬品開発・品質リスクマネジメント・医薬品品質システムの枠組みであり、直接的にXAIを要求する文書ではない点も誤解しやすいので注意が必要です。SHAPは、これらの枠組みの中で透明性・モデル理解を支援する選択肢の一つとして位置づけるのが妥当です。

１０．まとめ：SHAPは「代表的なXAI手法の一つ」として活用しよう

SHAPは、ゲーム理論に基づく堅牢な理論的基盤と、創薬・分子グラフ解釈に特化した派生的手法（MolSHAP・EdgeSHAPer）を備えた、AI創薬で広く用いられる代表的なXAI手法の一つです。Pythonライブラリも成熟しており、TreeExplainer・KernelExplainer・DeepExplainerを使い分けることで、既存の創薬ワークフローに組み込めます。

一方で、SHAP値は因果効果ではなく、特徴量相関や適用範囲の影響を受ける点、そして実験的検証・専門家判断の代替にはならない点は強調しておくべきです。「予測できる」だけでなく「説明を試みる」ことで、創薬研究者がモデルとより建設的に対話できるようになる――SHAPはそのための重要な道具の一つとして、今後も発展していくでしょう。

参考文献・リソース

SHAP Documentation：https://shap.readthedocs.io/en/latest/
SHAP GitHub：https://github.com/shap/shap
MolSHAP（ACS JCIM 2024）：https://pubs.acs.org/doi/10.1021/acs.jcim.3c00465
EdgeSHAPer（iScience 2022）：https://www.sciencedirect.com/science/article/pii/S2589004222013153
EdgeSHAPer GitHub（GPL-3.0）：https://github.com/AndMastro/EdgeSHAPer
Wiley XAI Review（Lavecchia 2025）：https://wires.onlinelibrary.wiley.com/doi/10.1002/wcms.70049
Reprocell: SHAP in Pharmacology：https://www.reprocell.com/blog/biopta/ai-in-drug-discovery-the-role-of-shap-in-pharmacology
Christoph Molnar: Interpretable ML Book（Shapley Values章）：https://christophm.github.io/interpretable-ml-book/shapley.html

免責事項

本記事は、AI創薬におけるSHAP（解釈可能な機械学習）に関する情報提供を目的として作成されたものです。記事の内容は、公開時点で入手可能な文献・情報に基づいていますが、技術の進歩や新たな知見、規制動向の変化により情報が変更される場合があります。記事に記載されたソフトウェアやツールの使用結果、およびそれに基づく研究成果について、筆者および本ブログは一切の責任を負わないものとします。SHAPはモデル予測の解釈を支援する手法であり、化学構造と活性・毒性の因果関係を証明するものではありません。実際の創薬研究や臨床応用にあたっては、必ず最新の文献・公式ドキュメント・規制ガイダンスを確認し、実験的検証や専門家の助言を得てください。

本記事は生成AIを活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。

１．はじめに：AI創薬とブラックボックス問題