AI創薬の新基準「Chemprop」とは？ADMET予測で加速する次世代の新薬開発

本記事では、米国マサチューセッツ工科大学（MIT）が開発したオープンソースの分子特性予測ツール「Chemprop（ケムプロップ）」について、コア技術であるD-MPNN（有向メッセージパッシングニューラルネットワーク）から、最新のChemprop v2の改良点、ADMET-AIプラットフォームでの活用例まで、医療関係者・研究者向けにわかりやすく解説します。

2. Chempropとは？MITが開発した深層学習による分子特性予測ライブラリ

Chempropは、MITのRegina Barzilayらのグループが開発したオープンソース（MITライセンス）の深層学習ソフトウェアパッケージで、PyTorchをベースに動作します。誰でも自由に研究・商用利用できる点が大きな魅力です。

最大の特徴は、分子をグラフ構造として直接読み込み、原子と結合の情報からエンドツーエンドで特徴量を学習する点にあります。従来のフィンガープリントなど固定された分子記述子（あらかじめ定義された分子の特徴量）とは異なり、タスクごとに最適な表現をモデル自身が獲得していきます。

主要論文は2024年に Journal of Chemical Information and Modeling（JCIM）に掲載されたHeidらの「Chemprop: A Machine Learning Package for Chemical Property Prediction」で、回帰・分類・スペクトル予測など幅広いタスクに対応しています。

3. なぜADMET予測でChempropが選ばれるのか

ADMETは、創薬におけるGo/No-Go判断（開発を進めるか中止するかの判断）を決める重要な特性群です。臨床試験で薬が脱落する原因の多くは、薬効そのものよりもADMET面の問題、すなわち毒性や代謝、体内動態に起因するとされます。

Chempropは、Therapeutics Data Commons（TDC）のADMETベンチマークで高い性能を示しており、特に薬物性肝障害（DILI）など機構が複雑なエンドポイントでは、フィンガープリントベース手法を上回ることが報告されています。これは、分子構造から直接学習した表現が、未知の毒性メカニズムを捉えるうえで有利に働く好例といえます。

加えて、不確実性定量化や転移学習、マルチタスク学習などの機能が標準で備わっており、ADMETのように「データ量がエンドポイントごとに偏っている」課題にも柔軟に対応できる点が、創薬研究の実務で選ばれる理由となっています。

4. ベンチマーク性能と実績

ChempropはTDC ADMETリーダーボードを中心に、多くの公開ベンチマークで競争力ある成績を収めてきました。代表的な性能・実績は以下の通りです。

TDC ADMETベンチマークの複数エンドポイントで上位常連
水・オクタノール分配係数、反応障壁高さ、原子部分電荷、吸収スペクトル予測などで最先端の精度
2025年のPolaris抗ウイルスADME予測チャレンジで、ChempropのマルチタスクD-MPNNモデルが39参加チーム中2位を獲得
MITのStokesらによる新規抗生物質Halicin（ハリシン）の発見（Cell, 2020）で基盤技術として活用

これらの結果は、Chempropが研究レベルにとどまらず、実用的な大規模スクリーニングにも耐える性能を備えていることを示しています。特にHalicinの発見は、AI創薬が「実際に新薬候補を生み出した」象徴的事例として広く知られています。

5. D-MPNNアーキテクチャの仕組み

Chempropの中核技術は、D-MPNN（Directed Message Passing Neural Network、有向メッセージパッシングニューラルネットワーク）です。従来のMPNNが原子（ノード）間でメッセージを更新するのに対し、D-MPNNでは結合（エッジ）に方向性を持たせ、有向エッジ間でメッセージを伝播させます。

5.1. アーキテクチャの4段階

D-MPNNの処理は次の4段階から構成されます。

局所特徴量エンコーディング：SMILES文字列を分子グラフに変換
D-MPNN本体：有向エッジ間でメッセージをパスし、原子埋め込みベクトルを学習
集約関数：原子埋め込みを分子全体の埋め込みベクトルに統合
フィードフォワードネットワーク（FFN）：分子埋め込みから目的特性へ写像

5.2. なぜエッジ指向なのか

エッジ間でメッセージを伝播させると、結合の方向性や局所環境の違いをより細かく区別できます。また、ノード起点のMPNNで起こりがちな「同じ情報の往復」を抑制でき、層を深く積み重ねても特徴が薄まりにくいという利点があります。これがD-MPNNの予測精度の高さを支える本質的なポイントです。

6. Chempropの使い方：インストールから学習まで

ChempropはPython 3.11または3.12に対応しており、pipまたはGitHubリポジトリからインストールできます。公式リポジトリは github.com/chemprop/chemprop、公式ドキュメントは chemprop.readthedocs.io で公開されています。

基本的なインストールは pip install chemprop の一行で完了し、GPU環境では公式手順に従ってPyTorchのCUDA版を別途導入します。CSV形式でSMILESと目的特性を準備し、コマンドラインの chemprop train サブコマンドにデータパス・タスク種別（回帰・分類など）・出力ディレクトリを渡すだけで学習を開始できます。

主要なハイパーパラメータは、メッセージパッシングの隠れ次元（既定300）、伝播の反復回数（既定3）、ドロップアウト率、エポック数、バッチサイズ、アンサンブル数などです。Pythonからも from chemprop import data, models, nn のように直接呼び出せるため、独自の前処理や評価ループに組み込みやすい点も実務では重宝します。

7. Chemprop v2と関連プラットフォームの比較

2025年9月にJCIMで正式に報告されたChemprop v2は、コードベースの全面書き直しにより、実行時間が約2倍速く、メモリ使用量は約3分の1に改善されました。さらにマルチGPU学習にネイティブ対応し、より大規模なモデルや多タスク学習を回しやすくなっています。

Chemprop v2：高速化・モジュール化されたコア。新規導入はv2推奨
ADMET-AI v2：Chemprop v2を採用したADMET特化プラットフォーム。41のADMET特性に加え、RDKitで8つの物性を計算
公式Webサーバー：admet.ai.greenstonebio.com で最大1,000化合物を一括予測可能

実務的には、まずWeb版ADMET-AIで候補化合物のADMETプロファイルを大づかみに把握し、自社データを使った精緻な予測ではChemprop v2を直接学習させる、という二段構えがおすすめです。生成AIが生み出す膨大な候補化合物を絞り込むワークフローのコアに据えやすい構成といえます。

8. まとめ：Chempropは創薬研究者の標準ツールへ

Chempropは、分子グラフから直接ADMETや物性を予測できる、現代AI創薬の中核ツールの一つです。D-MPNNによる強力な表現学習に加え、不確実性定量化、転移学習、マルチタスク学習などの機能が一体化しており、抗生物質Halicinの発見のような世界的成果から、自社データを使った日々のスクリーニングまで、幅広いシーンで活用できます。

2025年に登場したChemprop v2では、計算効率と使いやすさが大幅に向上し、ADMET-AIなど周辺プラットフォームも続々と更新されています。創薬研究者にとっては、Chempropを「すぐ使えるツール」のひとつとして手元に置いておくことが、これからの研究スピードを大きく左右するはずです。

参考文献・リンク

Chemprop v1論文（J. Chem. Inf. Model. 2024）：https://pubs.acs.org/doi/10.1021/acs.jcim.3c01250
Chemprop v2論文（J. Chem. Inf. Model. 2025）：https://pubs.acs.org/doi/10.1021/acs.jcim.5c02332
Chemprop GitHubリポジトリ：https://github.com/chemprop/chemprop
Chemprop公式ドキュメント：https://chemprop.readthedocs.io/
ADMET-AI公式Webサーバー：https://admet.ai.greenstonebio.com/
ADMET-AI GitHubリポジトリ：https://github.com/swansonk14/admet_ai
Halicin発見論文（Cell 2020）：https://www.cell.com/cell/fulltext/S0092-8674(20)30102-1
TDC ADMETベンチマークグループ：https://tdcommons.ai/benchmark/admet_group/overview/

免責事項

本記事は、Chempropに関する情報提供を目的として作成されたものです。記事の内容は、公開時点で入手可能な文献・情報に基づいていますが、技術の進歩や新たな知見により、情報が変更される場合があります。記事に記載されたソフトウェアの使用結果や、それに基づく研究成果について、筆者および本ブログは一切の責任を負わないものとします。実際の創薬研究や臨床応用にあたっては、必ず最新の文献・公式ドキュメントを確認し、専門家の助言を得てください。

本記事は生成AIを活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。　Amazonでこの関連書籍「化学のためのPythonによるデータ解析・機械学習入門」を見る

1. はじめに：AI創薬の成否を握るADMET予測とChemprop