TANKBindがもたらす3つの革新。物理的制約(幾何学)を取り込むことで、未知のタンパク質に対しても圧倒的な予測精度を実現します。
構造ベース創薬(SBDD)において、タンパク質とリガンド(薬物候補分子)がどのように結合するかを正確に予測することは、新薬開発の成否を左右する極めて重要なステップです。しかし、従来の分子ドッキング手法には「計算コストが高い」「結合部位を事前に指定しなければならない」という2つの大きな課題がありました。こうした課題を根本から解決するのが、深層学習ベースの結合構造予測ツール「TANKBind」です。
TANKBindは、結合部位の事前指定が不要な「ブラインドドッキング」に対応し、結合構造と結合親和性を同時に予測できる画期的なAI創薬ツールとして、世界中の創薬研究者から注目を集めています。
本記事では、TANKBindの仕組みと特徴、従来手法との違い、ベンチマークでの評価結果、そして実際の使い方までをわかりやすく解説します。この記事を読むことで、以下の内容が理解できます。
・TANKBindの基本的な仕組みと三角関数制約の役割
・ブラインドドッキングが従来手法に比べてなぜ優れているのか
・新規タンパク質に対する予測精度が42%向上した理由
・TANKBindのインストール方法と実行手順
・EquiBind・DiffDock・AutoDock Vinaとの使い分け
AI創薬やSBDD(構造ベース創薬)に関心のある研究者・薬剤師の方にとって、結合様式予測の最新アプローチを理解するための実践的なガイドとなれば幸いです。
TANKBind(Trigonometry-Aware Neural NetworKs for Drug-Protein Binding Structure Prediction)は、2022年にNeurIPS(機械学習分野のトップ国際会議)で発表された深層学習モデルです。Galixir Technologies(ガリクサー・テクノロジーズ)の研究チームが開発し、オープンソースとしてGitHubで公開されています。
このAI創薬ツールの最大の特徴は、三角関数に基づく幾何学的制約(Trigonometry Constraint)をニューラルネットワークに組み込んでいる点です。原子間の距離や角度の関係を三角関数で表現することで、タンパク質とリガンドの三次元的な結合構造をより正確に予測できます。
さらに、TANKBindはタンパク質-リガンド間の結合構造(バインディングポーズ)と結合親和性(バインディングアフィニティ)の両方を同時に予測できる点も大きな強みです。つまり、「どこにどう結合するか」と「どれくらい強く結合するか」を1回の計算で同時に評価できるのです。この特徴は、大量の化合物を短時間でスクリーニングする際に非常に有効です。
従来の分子ドッキングツール(AutoDock VinaやGNINAなど)では、結合部位(ポケット)の位置を事前に指定する必要がありました。これは「事前に答えを知っている」状態での予測であり、未知のタンパク質や新規の結合部位を探索する場面では大きな制約となります。
TANKBindは、タンパク質全体を機能的なブロックに分割し、すべての候補結合部位に対して同時に予測を行う「ブラインドドッキング」に対応しています。つまり、結合部位の事前指定なしに、リガンドがタンパク質のどこに結合するかを自動的に推定できるのです。この機能は、SBDD(構造ベース創薬)のワークフローを大幅に効率化します。
さらに、従来の分子ドッキング手法では見つけにくかった未知の結合部位を発見できる可能性もあります。これは、既存の薬とは異なる作用機序(メカニズム・オブ・アクション)を持つ新薬候補の探索に役立つ画期的な特長です。新しい創薬ターゲットの発見にもつながるため、AI創薬の分野で大きな期待が寄せられています。
TANKBindの性能は、複数のベンチマークデータセットで厳密に検証されています。特に注目すべき結果として、リガンドのRMSD(Root Mean Square Deviation:予測構造と実測構造のズレを表す指標)が5オングストローム未満の予測の割合が、以下のように大幅に改善されました。
・リドッキング(既知の結合構造を再現する設定):従来手法比で16%向上
・セルフドッキング(同一タンパク質の異なるリガンドを予測):22%向上
・新規タンパク質設定(学習データにないタンパク質での予測):42%向上
特に注目すべきは、新規タンパク質に対する予測精度の42%という大幅な向上です。実際の創薬研究では、新薬のターゲットとなるタンパク質はこれまで結合構造が知られていない新規の標的であることが多いため、この改善は実務的に非常に大きな価値を持ちます。
また、結合親和性の予測においても、実験で測定された値との相関が従来手法を上回っています。これにより、バーチャルスクリーニングで得られたヒット化合物の優先順位付けがより正確に行え、創薬プロセス全体の効率化に貢献します。
TANKBindの技術的な核心は、大きく2つの革新的なポイントに集約されます。
タンパク質とリガンドの原子間の位置関係を、三角関数を用いた幾何学的制約として明示的にモデルに組み込んでいます。これにより、物理的に妥当な三次元構造のみが予測されやすくなり、非現実的なバインディングポーズの生成を効果的に抑制します。この設計により、AI創薬における予測の信頼性が大幅に向上しています。
局所領域のネガティブサンプリングを用いた新しいコントラスト損失関数を導入しています。正しい結合部位(ポジティブサンプル)と非結合部位(ネガティブサンプル)を対比的に学習することで、ブラインドドッキングにおける結合部位の識別精度を高めています。結合相互作用と結合親和性を同時に最適化する設計により、TANKBindは単一のモデルで複数の予測タスクを処理できます。
TANKBindはオープンソースとしてGitHubで公開されており、研究者であれば誰でも無料で利用できます。以下に基本的な導入と実行の流れを示します。
まず、Python 3.8環境をConda(またはMamba)で構築します。主な依存ライブラリとして、PyTorch、PyTorch Geometric(幾何学的深層学習ライブラリ)、RDKit(化学情報処理ライブラリ)などが必要です。GPUを使用する場合は、CUDAツールキットのバージョンを環境に合わせて調整してください。
入力データとしては、タンパク質の立体構造ファイル(PDB形式)とリガンドの分子構造(SDFまたはSMILES形式)が必要です。タンパク質構造はPDB(Protein Data Bank)やAlphaFold Protein Structure Databaseから取得できます。
学習済みモデルが提供されているため、推論スクリプトを実行するだけで結合構造の予測が可能です。出力として、予測された結合ポーズ(リガンドの三次元座標)と結合親和性のスコアが得られます。
リポジトリURL:https://github.com/luwei0917/TankBind
TANKBindは、近年登場したAIベースのドッキング手法の中でも独自のポジションを占めています。主要な手法との比較を整理し、それぞれの最適な使い分けを解説します。
・EquiBind:TANKBindと同様にブラインドドッキングに対応する先駆的手法ですが、TANKBindは予測精度でEquiBindを上回っています。
・DiffDock:拡散モデルベースのアプローチで、TANKBindとは異なる生成的なアプローチを採用しています。DiffDockはポーズのサンプリング多様性に優れ、TANKBindは結合親和性の同時予測に強みがあります。
・AutoDock Vina / GNINA:物理ベースの従来手法であり、長い歴史に裏打ちされた高い信頼性を持ちますが、計算速度と新規タンパク質への汎化性能ではAI手法に劣ります。
実務的には、TANKBindを第一スクリーニングに使い、有望な候補をAutoDock VinaやGNINAで再評価するというハイブリッドなアプローチが効果的です。AI創薬と従来手法の長所を組み合わせることで、より確度の高い創薬パイプラインを構築できます。
本記事では、深層学習ベースの結合構造予測ツール「TANKBind」について、その技術的な仕組みから実際の使い方まで詳しく解説しました。
TANKBindは、三角関数制約を組み込んだ独自のニューラルネットワークアーキテクチャにより、タンパク質-リガンドの結合構造と親和性を高精度に予測できるAI創薬ツールです。特に、結合部位の事前指定が不要なブラインドドッキング対応と、新規タンパク質への予測精度42%向上という高い汎化性能は、SBDD(構造ベース創薬)の実務において大きな変革をもたらす可能性を秘めています。
オープンソースで公開されており、Google ColabやGPU環境があれば比較的容易に試すことができます。AI創薬やSBDDに携わる研究者の方は、ぜひTANKBindを実際に試していただき、従来のドッキング手法との予測結果の違いを体感してみてください。
・TANKBind論文(NeurIPS 2022):https://proceedings.neurips.cc/paper_files/paper/2022/hash/2f89a23a19d1617e7fb16d4f7a049ce2-Abstract-Conference.html
・TANKBind GitHub:https://github.com/luwei0917/TankBind
・TANKBind bioRxiv preprint:https://www.biorxiv.org/content/10.1101/2022.06.06.495043v1
本記事は、AI創薬および分子ドッキングに関する情報提供を目的として作成されたものです。記事の内容は、公開時点で入手可能な文献・情報に基づいていますが、技術の進歩や新たな知見により、情報が変更される場合があります。記事に記載されたソフトウェアの使用結果や、それに基づく研究成果について、筆者および本ブログは一切の責任を負わないものとします。実際の創薬研究や臨床応用にあたっては、必ず最新の文献・公式ドキュメントを確認し、専門家の助言を得てください。
本記事は生成AIを活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。
Amazonでこの関連書籍「実験医学増刊 Vol.44 No.5 AI・データ駆動型創薬研究〜マルチオミクス✕ケモインフォマティクスでより確実な治療標的を見つけ、薬をデザインする」を見る