1. はじめに:AI創薬の成否を握るADMET予測とChemprop
AI創薬の現場では、候補化合物がヒトの体内でどのように振る舞うかを早期に見極めることが、開発の成否を左右します。なかでもADMET(吸収・分布・代謝・排泄・毒性)特性の予測は、後期段階での失敗コストを下げる鍵として、いま大きな注目を集めています。
本記事では、米国マサチューセッツ工科大学(MIT)が開発したオープンソースの分子特性予測ツール「Chemprop(ケムプロップ)」について、コア技術であるD-MPNN(有向メッセージパッシングニューラルネットワーク)から、最新のChemprop v2の改良点、ADMET-AIプラットフォームでの活用例まで、医療関係者・研究者向けにわかりやすく解説します。
2. Chempropとは?MITが開発した深層学習による分子特性予測ライブラリ
Chempropは、MITのRegina Barzilayらのグループが開発したオープンソース(MITライセンス)の深層学習ソフトウェアパッケージで、PyTorchをベースに動作します。誰でも自由に研究・商用利用できる点が大きな魅力です。
最大の特徴は、分子をグラフ構造として直接読み込み、原子と結合の情報からエンドツーエンドで特徴量を学習する点にあります。従来のフィンガープリントなど固定された分子記述子(あらかじめ定義された分子の特徴量)とは異なり、タスクごとに最適な表現をモデル自身が獲得していきます。
主要論文は2024年に Journal of Chemical Information and Modeling(JCIM)に掲載されたHeidらの「Chemprop: A Machine Learning Package for Chemical Property Prediction」で、回帰・分類・スペクトル予測など幅広いタスクに対応しています。
3. なぜADMET予測でChempropが選ばれるのか
ADMETは、創薬におけるGo/No-Go判断(開発を進めるか中止するかの判断)を決める重要な特性群です。臨床試験で薬が脱落する原因の多くは、薬効そのものよりもADMET面の問題、すなわち毒性や代謝、体内動態に起因するとされます。
Chempropは、Therapeutics Data Commons(TDC)のADMETベンチマークで高い性能を示しており、特に薬物性肝障害(DILI)など機構が複雑なエンドポイントでは、フィンガープリントベース手法を上回ることが報告されています。これは、分子構造から直接学習した表現が、未知の毒性メカニズムを捉えるうえで有利に働く好例といえます。
加えて、不確実性定量化や転移学習、マルチタスク学習などの機能が標準で備わっており、ADMETのように「データ量がエンドポイントごとに偏っている」課題にも柔軟に対応できる点が、創薬研究の実務で選ばれる理由となっています。
4. ベンチマーク性能と実績
ChempropはTDC ADMETリーダーボードを中心に、多くの公開ベンチマークで競争力ある成績を収めてきました。代表的な性能・実績は以下の通りです。
- TDC ADMETベンチマークの複数エンドポイントで上位常連
- 水・オクタノール分配係数、反応障壁高さ、原子部分電荷、吸収スペクトル予測などで最先端の精度
- 2025年のPolaris抗ウイルスADME予測チャレンジで、ChempropのマルチタスクD-MPNNモデルが39参加チーム中2位を獲得
- MITのStokesらによる新規抗生物質Halicin(ハリシン)の発見(Cell, 2020)で基盤技術として活用
これらの結果は、Chempropが研究レベルにとどまらず、実用的な大規模スクリーニングにも耐える性能を備えていることを示しています。特にHalicinの発見は、AI創薬が「実際に新薬候補を生み出した」象徴的事例として広く知られています。
5. D-MPNNアーキテクチャの仕組み
Chempropの中核技術は、D-MPNN(Directed Message Passing Neural Network、有向メッセージパッシングニューラルネットワーク)です。従来のMPNNが原子(ノード)間でメッセージを更新するのに対し、D-MPNNでは結合(エッジ)に方向性を持たせ、有向エッジ間でメッセージを伝播させます。
5.1. アーキテクチャの4段階
D-MPNNの処理は次の4段階から構成されます。
- 局所特徴量エンコーディング:SMILES文字列を分子グラフに変換
- D-MPNN本体:有向エッジ間でメッセージをパスし、原子埋め込みベクトルを学習
- 集約関数:原子埋め込みを分子全体の埋め込みベクトルに統合
- フィードフォワードネットワーク(FFN):分子埋め込みから目的特性へ写像
5.2. なぜエッジ指向なのか
エッジ間でメッセージを伝播させると、結合の方向性や局所環境の違いをより細かく区別できます。また、ノード起点のMPNNで起こりがちな「同じ情報の往復」を抑制でき、層を深く積み重ねても特徴が薄まりにくいという利点があります。これがD-MPNNの予測精度の高さを支える本質的なポイントです。
6. Chempropの使い方:インストールから学習まで
ChempropはPython 3.11または3.12に対応しており、pipまたはGitHubリポジトリからインストールできます。公式リポジトリは github.com/chemprop/chemprop、公式ドキュメントは chemprop.readthedocs.io で公開されています。
基本的なインストールは pip install chemprop の一行で完了し、GPU環境では公式手順に従ってPyTorchのCUDA版を別途導入します。CSV形式でSMILESと目的特性を準備し、コマンドラインの chemprop train サブコマンドにデータパス・タスク種別(回帰・分類など)・出力ディレクトリを渡すだけで学習を開始できます。
主要なハイパーパラメータは、メッセージパッシングの隠れ次元(既定300)、伝播の反復回数(既定3)、ドロップアウト率、エポック数、バッチサイズ、アンサンブル数などです。Pythonからも from chemprop import data, models, nn のように直接呼び出せるため、独自の前処理や評価ループに組み込みやすい点も実務では重宝します。
7. Chemprop v2と関連プラットフォームの比較
2025年9月にJCIMで正式に報告されたChemprop v2は、コードベースの全面書き直しにより、実行時間が約2倍速く、メモリ使用量は約3分の1に改善されました。さらにマルチGPU学習にネイティブ対応し、より大規模なモデルや多タスク学習を回しやすくなっています。
- Chemprop v2:高速化・モジュール化されたコア。新規導入はv2推奨
- ADMET-AI v2:Chemprop v2を採用したADMET特化プラットフォーム。41のADMET特性に加え、RDKitで8つの物性を計算
- 公式Webサーバー:admet.ai.greenstonebio.com で最大1,000化合物を一括予測可能
実務的には、まずWeb版ADMET-AIで候補化合物のADMETプロファイルを大づかみに把握し、自社データを使った精緻な予測ではChemprop v2を直接学習させる、という二段構えがおすすめです。生成AIが生み出す膨大な候補化合物を絞り込むワークフローのコアに据えやすい構成といえます。
8. まとめ:Chempropは創薬研究者の標準ツールへ
Chempropは、分子グラフから直接ADMETや物性を予測できる、現代AI創薬の中核ツールの一つです。D-MPNNによる強力な表現学習に加え、不確実性定量化、転移学習、マルチタスク学習などの機能が一体化しており、抗生物質Halicinの発見のような世界的成果から、自社データを使った日々のスクリーニングまで、幅広いシーンで活用できます。
2025年に登場したChemprop v2では、計算効率と使いやすさが大幅に向上し、ADMET-AIなど周辺プラットフォームも続々と更新されています。創薬研究者にとっては、Chempropを「すぐ使えるツール」のひとつとして手元に置いておくことが、これからの研究スピードを大きく左右するはずです。
参考文献・リンク
- Chemprop v1論文(J. Chem. Inf. Model. 2024):https://pubs.acs.org/doi/10.1021/acs.jcim.3c01250
- Chemprop v2論文(J. Chem. Inf. Model. 2025):https://pubs.acs.org/doi/10.1021/acs.jcim.5c02332
- Chemprop GitHubリポジトリ:https://github.com/chemprop/chemprop
- Chemprop公式ドキュメント:https://chemprop.readthedocs.io/
- ADMET-AI公式Webサーバー:https://admet.ai.greenstonebio.com/
- ADMET-AI GitHubリポジトリ:https://github.com/swansonk14/admet_ai
- Halicin発見論文(Cell 2020):https://www.cell.com/cell/fulltext/S0092-8674(20)30102-1
- TDC ADMETベンチマークグループ:https://tdcommons.ai/benchmark/admet_group/overview/
免責事項
本記事は、Chempropに関する情報提供を目的として作成されたものです。記事の内容は、公開時点で入手可能な文献・情報に基づいていますが、技術の進歩や新たな知見により、情報が変更される場合があります。記事に記載されたソフトウェアの使用結果や、それに基づく研究成果について、筆者および本ブログは一切の責任を負わないものとします。実際の創薬研究や臨床応用にあたっては、必ず最新の文献・公式ドキュメントを確認し、専門家の助言を得てください。
本記事は生成AIを活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。 Amazonでこの関連書籍「化学のためのPythonによるデータ解析・機械学習入門」を見る
Amazonでこの関連書籍「化学のためのPythonによるデータ解析・機械学習入門」を見る
