Googleが開発した医療用AI「AMIE」が、医療現場での診断や意思決定を支援——医療スタッフとの自然な対話が可能な次世代診療支援ツール
Googleが開発した医療特化型の大規模言語モデル「AMIE(Articulate Medical Intelligence Explorer)」が、臨床医の診断精度向上に大きく貢献すると注目されています。Nature誌に掲載された2025年の論文によると、AMIEは単なる医学知識の応答ではなく、医師と同様の思考プロセスを模倣し、患者との対話を通じて診断を進めます。
その中核には、Googleの基盤モデル「PaLM 2」があり、膨大な医療情報と自然言語対話技術が統合されています。
AMIEは、患者との自然な対話によって情報を収集し、複数の可能性を検討する「鑑別診断」に基づいて推論を行います。この設計思想により、従来の単一回答型医療AIとは一線を画しています。
また、会話の文脈や患者の状態に応じて応答内容を柔軟に変化させる「状態認識型対話フレームワーク」も採用。これにより、実際の診療に近い自然な対話を実現しています。
AMIEは、自ら医師と患者の役を交互に演じる「Self-play方式」の訓練手法を採用しています。これにより、多様な症例に対応できる柔軟な診断力を獲得しています。
さらに、医師国家試験問題(MedQA)、医療面接データ、電子カルテ要約など、実用性の高い医療データセットで学習しており、現場への即応力が高いモデルとなっています。
AMIEは、患者から得られた情報を段階的に分析する「Chain-of-reasoning(推論の連鎖)」を実行します。具体的には、症状の把握 → 仮説の構築 → 情報の追加収集 → 鑑別診断の提案という一連の流れを再現しており、医師の臨床思考に近い診断支援が可能です。
従来のLLMはテキスト情報のみに対応していましたが、AMIEは皮膚画像や心電図、検査結果のPDFといったマルチモーダルデータも解析可能です。
これは、Googleの最新マルチモーダルモデル「Gemini 2.0 Flashのような軽量かつマルチモーダル対応の大規模言語モデル」をベースに実装されており、視覚・聴覚的情報を含めた総合的な診断支援を実現します。
AMIEの精度は、最新のGPT-4を含む他の医療用LLMと比較しても優れており、NEJM Clinical Pathological Conference(CPC)における診断正答率試験では、臨床医の33.6%を大きく上回る59.1%を達成しています。
また、生成される鑑別診断リストの質や網羅性においても、包括的かつ的確な結果を示しています。
AMIEは、臨床医が使用することで診断正答率が44.4%から51.7%に向上したことが報告されています。これは、検索ツールを利用した従来の診断支援を凌駕する成果です。
さらに、AMIEは研修医や医学生にとって、診断プロセスの学習ツールとしても有用であり、ケーススタディを通じて思考のトレースや自己評価が可能です。
最新のマルチモーダルAMIEは、OSCE形式の評価スタディで、9つの診断能力評価項目中7つでプライマリケア医を上回る評価を獲得しました。医療データの統合処理、患者との会話能力、推論の正確性など、多角的な視点で優れた性能を証明しています。
AMIEは、今後以下のような分野での応用が期待されています。
これらの応用により、診断の質・スピードの向上と、医師の負担軽減が同時に進む可能性があります。
AMIEは、これまでの医療用LLMとは異なり、臨床現場の文脈に即した診断支援が可能な革新的なシステムです。特に、診断精度の向上、対話型支援、マルチモーダル対応といった特長は、これからのAI活用医療における新たなスタンダードとなるでしょう。
Googleによる先進的な技術実装により、AMIEは今後、世界中の医療現場においてより安全で正確な診療を支援するキープレイヤーとなると予想されます。
本記事の内容は2025年5月時点の情報に基づき作成されています。技術の進展やモデルの仕様変更により情報が変化する可能性があります。この記事の情報に基づいた医療判断・臨床行為については、読者自身の責任で行ってください。筆者および本記事はその責任を負いません。
本記事は生成AIを活用して作成しています。内容については十分に精査しておりますが、誤りが含まれる可能性があります。お気づきの点がございましたら、コメントにてご指摘いただけますと幸いです。
Amazonでこの関連書籍「LLMのプロンプトエンジニアリング: GitHub Copilotを生んだ開発者が教える生成AIアプリケーション開発」を見る