AIと物理シミュレーションが融合し、創薬研究を加速する未来のインシリコ創薬ラボのイメージです。
2025年11月、インシリコ創薬(コンピュータを用いた創薬研究)の世界は、かつてないほどの変革期を迎えています。ほんの数年前まで夢物語だった技術が、今や標準的な研究手法として定着しつつあります。この進化の核となっているのが、「AI(人工知能)・機械学習」と「物理化学ベースのシミュレーション」の高度な融合です。もはや、これら二つを別々に語ることはできません。
この記事では、インシリコ創薬に興味のある筆者が、2025年11月現在の「最先端の数値解析法・シミュレーション法」について、その核心を分かりやすく解説します。従来の計算手法がAIによってどう高速化・高精度化されたのか、そしてAIの予測が物理シミュレーションによってどう信頼性を得ているのか。現場の研究者が押さえておくべき最新トレンドを、ステップ・バイ・ステップでご紹介します。
2025年のインシリコ創薬において、ヒット化合物(新薬の候補)を見つけ出すための初期段階(スクリーニング)では、AIと物理シミュレーションを組み合わせた統合ワークフローが標準となっています。具体的には、「①AIによる超高速スクリーニング → ②分子ドッキングによる絞り込み → ③分子動力学(MD)シミュレーションによる精密検証」という三段階のアプローチです。
従来のインシリコ創薬では、数百万から数億にもおよぶ化合物データベース全体に対して、分子ドッキング(タンパク質の特定のポケットに化合物がどう結合するかを計算する手法)を行うのが一般的でした。しかし、これには膨大な計算コストがかかります。そこでまず、AI(機械学習モデル)を用いて、データベース内の全化合物が標的タンパク質に結合する可能性(活性)を瞬時に予測します。これにより、有望な化合物を数千~数万程度まで一気に絞り込むことができるのです。
その後、絞り込まれた化合物群に対してのみ、計算コストのかかる従来の分子ドッキングを実行します。さらに、ドッキングで良好な結果(高い結合親和性スコア)を示した数十~数百の化合物について、最後の仕上げとして分子動力学(MD)シミュレーションを行います。MDシミュレーションは、原子レベルでの分子の「動き」を時系列で追跡する手法で、化合物がタンパク質に結合した状態が本当に安定しているのかを、水の存在なども考慮したリアルな環境で検証できます。この「AIによる粗選び」と「物理による本選び」の組み合わせが、創薬の効率を劇的に向上させています。
ワークフローの最終段階を担うMDシミュレーションも、AIの恩恵や計算機の進化を受けています。例えば、GaMD(Gaussian accelerated Molecular Dynamics)という手法が注目されています。これは、タンパク質の構造変化のような稀(まれ)にしか起こらない現象を効率的に観測するためのシミュレーション技術で、AIと組み合わせることで、薬が効くメカニズム(作用機序)の解明がより現実的になっています。
また、日本のスーパーコンピュータ「富岳」のような超高性能コンピューティング(HPC)リソースを活用し、ウイルス全体や細胞膜全体といった10億原子規模の超大規模MDシミュレーションも可能になっています。これにより、個々のタンパク質だけでなく、より生体内に近い複雑な環境での薬物の挙動を解析できるようになりました。
構造ベース創薬(SBDD)は、標的タンパク質の立体構造に基づいて薬を設計する手法です。2020年代初頭に登場した「AlphaFold」がタンパク質の静的な構造予測に革命をもたらしましたが、2025年現在は、AIがさらにその先へと進んでいます。
AlphaFoldが予測したのはあくまで「静止画」としての構造です。しかし、実際のタンパク質は体内でダイナミックに動いています。現在の最先端AIモデルは、MDシミュレーションの結果や実験データを学習することで、タンパク質の「動き」や「揺らぎ」まで考慮した構造解析を可能にしています。
さらに、AIモデルは「結合親和性(どれだけ強く結合するか)」の予測精度も飛躍的に向上させました。例えば、Transformer(大規模言語モデルの基盤技術)やGNN(グラフニューラルネットワーク)を組み合わせた「DeepTGIN」のようなハイブリッドアプローチが登場しています。これらは、タンパク質と化合物の複雑な相互作用を学習し、従来のスコアリング関数(ドッキングで使われる簡易的な評価関数)よりもはるかに正確な結合予測を実現しています。
2025年のSBDDで最も注目されている技術の一つが、AIによる「デ・ノボ設計(De Novo Design)」、すなわちAIがゼロから新しい化合物を設計(生成)する技術です。これまでは、AIが有望な構造を生成しても、それが標的タンパク質のポケットに実際にどう結合するのかは、別途ドッキング計算を行う必要がありました。
しかし、「PoLiGenX」のような最新の生成モデルは、標的タンパク質のポケット構造を指定するだけで、その内部で安定的に結合するであろう化合物の構造と、その結合様式(ポーズ)を同時に生成・予測することができます。これにより、設計サイクルが大幅に短縮され、より効率的に有望なリード化合物を生み出せるようになっています。
新薬開発の成功確率を上げるには、有効性(薬効)だけでなく、安全性(毒性)や体内動態(ADMET:吸収、分布、代謝、排泄)を早期に予測することが不可欠です。AIはこの分野でも標準的なツールとなっています。
創薬開発で頻繁に問題となるのが、心臓への副作用(hERGチャネル阻害による致死性不整脈)です。このhERG毒性を高精度で予測するために、特化したAIモデルが開発されています。例えば、「AttenhERG」フレームワークは、GNN(グラフニューラルネットワーク)を用いて化合物の構造からhERG毒性の有無を予測します。
GNNは、化合物を原子(ノード)と結合(エッジ)からなるグラフとして扱うため、分子のトポロジー(つながり方)を直感的に学習できるのが強みです。「CardioGenAI」のようなプラットフォームでは、毒性予測AIと化合物生成AIを組み合わせ、薬理活性を維持したままhERG毒性だけを回避するような、化合物の「再設計」も自動で行えるようになっています。
2025年のAIモデルは、単に「毒性あり/なし」を予測するだけではありません。「解釈可能性(Explainability)」が非常に重視されています。例えば、AttenhERGのようなモデルは、「アテンション機構」と呼ばれる技術を搭載しています。これにより、AIが毒性の原因だと判断した「分子のどの部分(特定の原子や官能基)」をハイライトして、研究者に視覚的に提示することができます。
これは、研究者が次に何をすべきかを判断する上で極めて重要です。AIが「なぜ」そう予測したのかが分かれば、その部分構造を修正して毒性を回避するなど、合理的な分子設計(ドラッグデザイン)につなげることができます。
AI創薬が実用化されるにつれ、二つの大きな課題が浮上しました。一つは「AIの予測はどれだけ信頼できるのか?」という信頼性の問題。もう一つは「高精度な計算(特に量子化学計算)は時間がかかりすぎる」という速度の問題です。2025年現在、これらの課題に対する革新的な解決策が登場しています。
分子のエネルギー状態や反応性を最も正確に計算できるのは「量子化学計算」ですが、特にDFT(密度汎関数理論)は計算コストが非常に高いのがネックでした。そこで、AIにDFTの計算結果を大量に学習させ、DFTと同等の精度を持つ予測を瞬時に行う「代替AIモデル」の開発が進んでいます。
「LAGNet」のような新しいアーキテクチャは、分子の3次元構造を効率的に学習し、有機分子のエネルギーや特性を高速かつ正確に予測できます。これにより、従来は時間がかかりすぎて不可能だった規模の分子に対しても、量子化学レベルの精密な解析を適用できるようになりつつあります。
AIモデルは時々、とんでもない間違いを犯すことがあります。実験コストの高い創薬において、AIの誤った予測を鵜呑みにするのは危険です。そこで、AIが自身の予測に対して「自信度(どれくらい確からしいか)」を提示する技術、すなわち「ベイジアン不確実性推定」が実装され始めています。
これは、AIが予測結果と同時に「この予測の不確実性は高い(自信がない)/低い(自信がある)」という数値も出力する技術です。研究者は、AIが「自信がある」と判断した予測だけを採用し、「自信がない」と判断した化合物については追加の計算や実験を行う、といった合理的な意思決定が可能になります。これにより、AIの予測をより安全かつ効率的に活用できるようになりました。
2025年のインシリコ創薬は、もはやコンピュータの中で計算予測をして終わり、ではありません。その予測をリアルタイムで実験に反映させ、創薬プロセス全体を自動化する動きが加速しています。
最先端の創薬プラットフォームは、インシリコでの「予測」と、ロボットによる「実験(合成・評価)」を統合し、自動でループ制御する「自律型化学ラボ(Self-Driving Labs)」へと進化しています。AIが「次に合成すべき最も有望な化合物」を予測し、その情報を自動で合成ロボットに送信。ロボットが化合物を合成・活性評価し、その新しい実験データをAIが即座に学習して、次の予測をさらに賢く行う…というサイクルです。
この「計算と実験のクローズドループ」は、創薬プロセスを劇的に高速化します。また、プライバシーを保護しながら複数の研究機関がデータを共同利用できる「Federated Learning(連合学習)」のような技術も導入され、創薬研究のエコシステム(生態系)そのものが変わりつつあります。
こうした最先端の技術は、もはや一部の大企業だけのものではありません。「GNINA」や「ChemProp」といった高性能なAI創薬ツールがオープンソースとして公開され、誰でも利用可能になっています。また、「Streamlit」のようなツールを使えば、専門家が開発したAI予測モデルを、実験系の研究者でも簡単に使えるWebアプリケーションとして迅速に展開できます。クラウドコンピューティングの普及と相まって、技術革新のハードルは劇的に下がっています。
2025年11月現在、インシリコ創薬の最前線は、「AIによる高速化・高精度化」と「物理シミュレーションによる妥当性の担保」という二つの大きな流れが、強力に融合している地点にあります。
AIはもはや単なる統計ツールではなく、分子の動きや量子化学的な性質といった「物理法則」を理解し始めています。今後は、タンパク質の配列、構造、動き、さらには論文テキストといった異なる種類の情報を統合的に扱う「マルチモーダルAI」の実用化や、量子コンピュータと連携した超高速シミュレーションも現実のものとなるでしょう。
これらの技術革新が目指すのは、従来10~15年かかっていた創薬プロセスを根本から変革することです。インシリコ創薬関係者として、私たちはこのエキサイティングな変化の最中にいます。最新の技術動向をキャッチアップし、これらの強力なツールを使いこなすことが、未来の創薬を担う鍵となるでしょう。
本記事は生成AIを活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。
Amazonでこの関連書籍「インシリコ創薬: 計算創薬の基礎から実例まで」を見る