Uni-Dockとは?GPUで1000倍高速化する分子ドッキングツールの使い方と特徴を解説

1. はじめに:なぜ今、GPUドッキングが必要なのか

創薬研究において、バーチャルスクリーニング(VS)は候補化合物を効率的に絞り込むための重要なプロセスです。その中核を担う分子ドッキングは、タンパク質(受容体)とリガンド(薬の候補分子)がどのように結合するかをコンピュータ上で予測する技術です。しかし近年、スクリーニング対象の化合物ライブラリは数千万から数十億規模にまで急拡大しており、従来のCPUベースのドッキングプログラムでは現実的な時間内に処理を完了することが極めて困難になっています。

こうした背景のもとで開発されたのが Uni-Dock です。DP Technology社が開発したこのGPU高速化分子ドッキングプログラムは、従来広く使われてきたAutoDock Vinaと比較して 1000倍以上の高速化 を実現しました。2023年にはJournal of Chemical Theory and Computation(JCTC)の表紙論文として掲載され、AI創薬コミュニティで大きな注目を集めています(Yu et al., JCTC, 2023, 19, 3336–3345)。

本記事では、Uni-Dockの技術的な特徴から実際の使い方まで、医療関係者やこれからAI創薬を学ぶ方にもわかりやすく解説します。


2. Uni-Dockの主な特徴:なぜ圧倒的に速いのか

Uni-Dockの最大の特徴は、GPU(Graphics Processing Unit:画像処理装置)の並列計算能力を最大限に活用している点です。通常のCPUが数個から数十個のコアで逐次的に処理を行うのに対し、GPUは数千個のコアを持ち、大量の計算を同時に実行できます。

Uni-Dockでは、1つのリガンドに対して複数の配座探索スレッドをGPU内で同時に起動します。さらに、複数のリガンドをバッチ処理することで、GPU/CPU間のデータ転送のボトルネックを排除し、GPU利用率を最大化しています。原著論文によると、NVIDIA V100 GPU上で3段階の最適化を経て、最終的に 1627倍 の速度向上を達成しています。

この圧倒的な速度は、既存のGPU対応ドッキングプログラムであるAutoDock-GPUやVina-GPUをも大幅に上回るものです。


3. 3つのスコアリング関数:目的に応じた柔軟な選択

スコアリング関数とは、タンパク質とリガンドの結合の「良さ」を数値化するための評価関数です。Uni-Dockは以下の3種類をサポートしています。

vina:AutoDock Vinaと同一のスコアリング関数で、Uni-Dockのデフォルト設定です。多くのドッキング研究で実績があり、初めて使う方にはこちらがおすすめです。

vinardo:vinaの改良版として開発されたスコアリング関数です。特定のターゲットにおいて、vinaよりも高い精度を示す場合があります。

ad4:AutoDock 4のスコアリング関数です。従来のAutoDock 4との結果比較が必要な場合や、特定の研究ワークフローとの互換性が求められる場合に有用です。

さらに、すべてのスコアリング関数において 水素結合バイアスドッキング がサポートされています。これは、特定の水素結合パターンを持つ配座を優先的に探索する機能で、より生物学的に妥当な結合様式を見つけやすくなります。


4. 3つの検索モード:スクリーニングの段階に応じた使い分け

Uni-Dockは、計算の目的に応じて3つの検索モードを選択できます。

fast(高速モード):計算速度を最優先したモードです。精度はやや低くなりますが、数千万規模の化合物ライブラリを対象とした初期スクリーニングに最適です。まず大量の化合物を粗くふるいにかける段階で威力を発揮します。

balance(バランスモード):速度と精度のバランスを取ったモードです。標準的なバーチャルスクリーニングに適しており、多くの場合このモードが推奨されます。

detail(詳細モード):精度を最優先したモードです。計算時間はかかりますが、候補を絞り込んだ後の詳細な結合様式の解析に向いています。

このように段階的なスクリーニング戦略を組めるのは、実際の創薬プロジェクトにおいて非常に実用的です。


5. 大規模スクリーニングの実力:3820万化合物を半日で処理

Uni-Dockの実力を最もよく示しているのが、原著論文で報告された大規模スクリーニングの実例です。Enamine Diverse REAL druglikeセットに含まれる 3820万分子 を、がん治療の重要な標的である KRAS G12D に対してドッキングした結果、100台のNVIDIA V100 GPUを用いてわずか 11.3時間 で処理が完了しました。

KRAS G12Dは、膵臓がんや大腸がんなどで高頻度に見られる変異型KRASタンパク質です。長年「undruggable(創薬困難)」と言われてきましたが、近年ようやく阻害剤の開発が進んでいるホットなターゲットです。このような注目度の高い標的に対して、数千万規模の化合物スクリーニングを半日で完了できるということは、創薬の初期段階を大幅に加速できることを意味しています。

6. インストールと基本的な使い方

Uni-Dockのインストールは比較的シンプルです。最も手軽なのはConda(パッケージ管理ツール)を使う方法です。

conda create -n unidock_env unidock -c conda-forge
conda activate unidock_env
unidock –help

上記のコマンドを順番に実行するだけで、すぐにUni-Dockを利用開始できます。CUDA toolkit 11.8以上が必要ですので、事前にNVIDIA GPUドライバとCUDAがインストールされていることを確認してください。

基本的なドッキング実行は以下のようなコマンドで行います。

unidock –receptor receptor.pdbqt \
–batch ligand1.pdbqt ligand2.pdbqt ligand3.pdbqt \
–center_x 0 –center_y 0 –center_z 0 \
–size_x 20 –size_y 20 –size_z 20 \
–scoring vina \
–dir output/ \
–exhaustiveness 128

ここで --receptor は受容体(タンパク質)のファイル、--batch はバッチ処理するリガンドファイル群、--center_x/y/z--size_x/y/z は検索空間(ドッキングを行う領域)の中心座標とサイズを指定します。--exhaustiveness は探索の徹底度を表し、Uni-Dockではデフォルト値が128に設定されています(AutoDock Vinaのデフォルト値8より大きいですが、GPU並列化により高速に処理されます)。

7. Uni-Dock Toolsとワークフローの効率化

大規模スクリーニングの実運用では、入出力ファイルの前処理や後処理も重要な工程です。Uni-Dock Toolsは、これらのワークフローを簡略化するためのPythonパッケージとして提供されています。

pip install unidock-tools

このツールにより、SDF形式などの一般的な化学構造ファイルを直接入力として使用でき、PDBQT形式への変換を自動的に処理してくれます。バーチャルスクリーニングの全体的なワークフローがよりスムーズになります。

8. 今後の展望:Uni-Dock2とAI創薬の未来

2025年時点で、DP Technology社はさらなる精度向上を目指した Uni-Dock2 の開発を進めています。Uni-Dock2ではアルゴリズムの大幅な改良が施されており、ドッキング精度のさらなる向上が期待されています。

また、2025年3月にはUni-Dockのライセンスが Apache License 2.0 に変更されました。これにより、商用利用を含む幅広い活用がより容易になり、アカデミアだけでなく製薬企業での導入も加速すると考えられます。

AI創薬の文脈では、Uni-Dockによる超高速バーチャルスクリーニングと、深層学習ベースの結合親和性予測モデルやde novo分子設計を組み合わせることで、ヒット化合物の発見からリード最適化までの期間をさらに短縮できる可能性があります。GPU技術の進化とともに、Uni-Dockは創薬研究における標準的なインフラとしての地位を確立しつつあります。

9. 発展版 UniDock-Pro:構造ベース・リガンドベース・ハイブリッドの統合プラットフォーム

2025年8月、エディンバラ大学のNiらにより、Uni-Dockの発展版である UniDock-Pro がプレプリントとして発表されました(Ni & Houston, ChemRxiv, 2025; DOI: 10.26434/chemrxiv-2025-bf5g7)。UniDock-Proは、Uni-Dock v1.1.3のGPUアーキテクチャをそのまま活用しつつ、従来の構造ベースバーチャルスクリーニング(SBVS)に加え、リガンドベースバーチャルスクリーニング(LBVS)と、両者を融合した ハイブリッドモード を1つのプラットフォームに統合しています。

LBVS(リガンドベーススクリーニング)とは、既知の活性化合物(参照リガンド)の形状や化学的特徴に基づいて、類似した化合物を探索する手法です。ターゲットタンパク質の立体構造が得られない場合や構造の質が低い場合に特に有効です。UniDock-Proでは、従来のAutoDock-SSで使われていた再帰的エネルギーモデルを、勾配ベースの最適化に適した滑らかなLennard-Jones型ポテンシャルに置き換えることで、DUDE-Zベンチマークにおいて早期認識率(EF₁%)を 2.45倍 改善しています。

ハイブリッドモードは、受容体由来のグリッドマップとリガンド由来のグリッドマップを実行時に統合し、配座探索中に構造情報とリガンド情報の両方を同時に活用します。DUDE-Z(43ターゲット)およびVSDS-vd TrueDecoys(147ターゲット)の2つのベンチマークにおいて、全モード中で最も高い早期認識率を一貫して達成しています。単一のNVIDIA RTX 4090 GPUで、balancedモードにおいて1日あたり約140万回の受容体-リガンドドッキングを処理できるスループットを実現しています。

さらに、ハイブリッドモードの性能を理解するために、Force Field Complementarity Analysis(FFCA:力場相補性分析)という新しい解析手法も提案されています。これにより、受容体とリガンドの力場が協調的に作用するケース(シナジー)と、相反するケース(干渉)を事前に診断でき、ターゲットに応じた最適なスクリーニング戦略の選択が可能になります。


9. まとめ

Uni-Dockは、GPUの並列計算能力を最大限に活用し、分子ドッキングの速度を飛躍的に向上させた革新的なプログラムです。AutoDock Vinaの1000倍以上の速度を維持しながら精度も確保し、3820万化合物のスクリーニングを半日で完了できる実力を持っています。3種類のスコアリング関数と3段階の検索モードによる柔軟な設定、Condaによる簡便なインストール、そしてApache License 2.0のオープンソースライセンスにより、アカデミアから製薬企業まで幅広く活用できるツールです。

超大規模化合物ライブラリの時代において、Uni-Dockはバーチャルスクリーニングの新たなスタンダードとなりつつあります。AI創薬に携わる方は、ぜひこのツールを研究のワークフローに取り入れてみてください。

参考文献・リンク

免責事項

本記事は、AI創薬および分子ドッキングに関する情報提供を目的として作成されたものです。記事の内容は、公開時点で入手可能な文献・情報に基づいていますが、技術の進歩や新たな知見により、情報が変更される場合があります。記事に記載されたソフトウェアの使用結果や、それに基づく研究成果について、筆者および本ブログは一切の責任を負わないものとします。実際の創薬研究や臨床応用にあたっては、必ず最新の文献・公式ドキュメントを確認し、専門家の助言を得てください。

本記事は生成AI を活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。

pharmaailab