Amazon Web Services ブログ

AWS ライフサイエンスエグゼクティブシンポジウム 2023 のハイライト:ML およびジェネレーティブ AI で創薬を加速する

5 月 15 日、ボストンでAWS ライフサイエンス・エグゼクティブ・シンポジウムが開催され、その中で私は「機械学習(ML)による創薬の加速」というテーマでトラックを担当しました。この半日の対面イベントには、100 を超える組織から 300 人以上のライフサイエンス企業のエグゼクティブが参加し、堅牢なデータ基盤とクラウド上の機械学習によってどのようにイノベーションを推進できるかを探りました。

本シンポジウムのオープニングセッションでは、AWS がどのようにライフサイエンス企業が創薬にジェネレーティブ AI, Foundation Models (FMs), LLM (Large Language Models)を活用することを可能にしているか、潜在的な副作用の特定や臨床試験データセットの検索などのユースケースを通して紹介しました。私たちは、オープンソースの様々な分子モデルに対して、簡単に実行できるタンパク質アルゴリズムを発表し、AWS が使用可能なタンパク質構造を生成するために必要なコストと時間を大幅に削減できることを実証しました。参加者は、AlphaFold と ESMFold アルゴリズムを単一の API またはコンソールでデプロイするための Amazon Omics サービス内の Ready2Run ワークフローに、透過的で実行ベースの価格設定とスケーラブルなインフラストラクチャでアクセスできることに注目していました。また、DiffDock, RFDesign, RFDiffusion, ProteinMPNN, AlphaFold, OpenFold, OmegaFold, ESMFold を含む複数のアルゴリズムを共有ユーザーインターフェースでサポートする、AWS Batch Architecture for Protein Folding and Design に基づく AWS の Drug Discovery Workbench のプレビューも行いました。

また、AWS が、適切なモデルの検索から、安全なカスタマイズ、既存のアプリケーションへの統合まで、FMs を使った構築が最も容易な場所である理由も示しました。AWS のジェネレーティブ AI に対するアプローチは ML と同じで、ライフサイエンス企業がジェネレーティブ AI を簡単に、コスト効率よく、実用的に活用できるような新しいイノベーションを提供することです。実際、AWS のお客様は、反復タスクのスピードアップから、タンパク質や疾患経路に関する新たな知見の発見まで、さまざまなユースケースですでにジェネレーティブ AI を活用しています。シンポジウムでは、Amazon HealthLake チャットボットや、Amazon Kendra と LLM を活用した臨床試験チャットボットなど、私たちが事前に訓練したモデルの一部を参加者にこっそりお見せしました。お客様は、今日からこれらの事前学習済みモデルを使い始めることができます。

セッションでは、基盤モデル、組み込みアルゴリズム、および事前に構築された ML ソリューションを備えた機械学習(ML)ハブであるAmazon SageMaker JumpStart を、ユーザーがわずか数クリックで開始できるようにする方法について説明しました。さまざまな業界のビルダーが、JumpStart で事前に訓練されたモデルを使用して、記事の要約や画像生成などのさまざまなタスクを実行しています。これらのモデルは、データを使用するあらゆるユースケースに合わせて完全にカスタマイズすることができ、ユーザーインターフェースまたは SDK を使用して本番環境に簡単に導入することができます。また、すべてのデータは暗号化され、仮想プライベートクラウド(VPC)を離れることがないため、データのプライバシーと機密性が保たれることが信頼できます。

同時に、ジェネレーティブAI を構築する際には選択肢が重要であることも理解しています。それが Amazon Bedrock を導入した理由です。Amazon Bedrock は、Foundation Models(FMs)を使ってジェネレーティブ AI アプリケーションを構築し、拡張する最も簡単な方法です。Amazon Bedrock は、AI21 Labs, Anthropic, Stability AI, および Amazon の FMs を API 経由でアクセス可能にし、独自のモデルを構築しているかサードパーティのものをライセンス供与しているかに関わらず、すべての構築者のアクセスを民主化します。また、セキュアなカスタマイズにも対応しているため、データはプライベートかつセキュアに保たれます。Amazon Bedrock は、Amazon S3 にあるいくつかのラベル付けされた例を示すだけで、大量のデータに注釈を付けることなく、タスクのモデルをファインチューニングすることができます。そして、エンド・ツー・エンドのデータ戦略を構築するという我々の包括的なテーマに沿って、私たちは、顧客が使い慣れたコントロールとAmazon SageMaker や Amazon S3 のような AWS の深さと幅のある機能との統合を使用して、AWS 上で実行されているアプリケーションとワークロードに FM を容易に統合し、デプロイできるようにしています。Amazon Bedrock は、1 つのソリューションや 1 つのモデルでは、お客様が直面する全てのビジネス上の問題を解決することは難しいというシンプルな事実に対応しています。

LLM やジェネレーティブ AI が、新しい治療法を発見するまでの時間を短縮するのに役立つことは間違いありません。しかし、研究の未来に多くの希望を生み出す一方で、現実の研究開発現場でのこれらの技術の採用はまだ限られています。 「Reverie Labs と Recursion Bio による誇大広告対希望のパネルディスカッション」がタイムリーであったのはこのためであり、研究においてジェネレーティブ AI の適用を成功させるための推進力と考慮事項、そして最も有望な分野について、参加者に明確な理解を提供しました。我々はまだジェネレーティブ AI の黎明期にあり、知識統合革命の始まりにいます。FMs と LLM は、その応用方法において大きな可能性を示しており、今後も斬新な応用や産業界での採用が拡大していくと考えられます。そして、アマゾンの Day 1 の文化に則り、これからも多くのことが起こるでしょう。

「創薬のための今後の ML イノベーションのセッション」では、今後勢いを増すと思われるエキサイティングな進歩について、聴衆を魅了する見解を示しました。これには、疾患遺伝子予測への FMs の利用、Meta AI ESM を用いた新規薬剤合成、拡散モデルを用いた創薬などが含まれます。また、共有された ML モデルを共同でトレーニングするために、組織内または組織間のデータセットへのプライバシーを保持したアクセスを提供する、連合学習についても取り上げました。さらに、ディープフェノタイピングとディープラーニングを画像解析に利用することで、デジタル病理学においてより高い精度、効率性、拡張性を実現する方法についても解説しました。

AWS の AI/ML サービスに関する話題は、AWS の著名なゲストスピーカーによるセッションへと続きました。先進的な企業数社のリーダーがステージに参加し、AWS 上の機械学習によって日常的な課題に対処し、新薬をより早く世に送り出す方法について、刺激的な実例を共有しました。

Bristol Myers Squibb 社は、「AWS を利用したハイパフォーマンス・コンピューティングとクライオ電子顕微鏡で、どのように生産性とスケールを最大化しているか」を紹介しました。高度に最適化されたアーキテクチャーを構築することで、これらの計算集約的なワークフローをオンプレミスで実行する際に一般的に直面する課題である、膨大な資産要件、GPU の老朽化、データセンターの可用性の制約、弾力性の欠如をうまく乗り越えています。BMS の目的に合ったクライオ電子顕微鏡ワークフローは、処理と解析のために顕微鏡から AWS に動画を転送し、コスト、スケール、スループットを最適化します。これにより、同社は医薬品開発期間を 10 年から 6 年に短縮するという目標に向けて前進しています。

Regeneron 社は、「AI を活用したタンパク質構造予測」による標的創薬プロセスの改善について発表しました。タンパク質の構造を特定することは、多くの創薬ワークフローの重要な部分ですが、高価であり、時間がかかることが多いです。ML でこの課題に対処するため、Regeneron 社は最先端のツールを科学者に提供し、複数のアプローチをテスト・比較し、原子レベルの精度まで数分でタンパク質の形状を予測できるようにしています。AWS は、データに適切なコンピュートリソースを提供し、コストを管理する弾力性を提供し、物理インフラストラクチャを管理する差別化にならない重労働を取り除くことで、同社がこれらのワークロードを拡張するのを支援しています。

Pfizer 社は、「セマンティックラーニングのためのナレッジグラフ(KG)を活用した組織内の情報を統合」についての洞察を共有しました。彼らのセッションは、データの標準化を通じてナレッジグラフの使いやすさを向上させることに光を当て、What-if シナリオとその潜在的な影響を探るためにKG の上にAI/ML を統合することを探求しました。レガシー製品のpH研究をサポートするための6年前のラボデータの検索や、臨床試験で使用される製品のロット系譜の研究など、さまざまなナレッジグラフのユースケースを通じて、KG が実験の繰り返しを防ぎ、材料費や人件費を数百万ドル節約するのに役立っていることを説明しました。特にエキサイティングなアプリケーションは、フルマネージド・データベース・サービスであるAmazon Neptune を使用して、Graph explorer を介して化学反応の経路を理解することでした。

そして最後に、Generate Biomedicines 社は、ML を活用した計算ツールを用いて新規タンパク質治療薬を生成することで、従来の試行錯誤的な創薬手法の必要性を排除していることを説明しました。同社のジェネレーティブ AI プラットフォームである Chroma が、Protein Data Bank からパターンを学習し、幾何学的および機能的プログラミング命令に基づいて新しいタンパク質分子を生成する方法を紹介しました。Chroma は、GPU1 つで非常に大きなタンパク質やタンパク質複合体(自然界で見られるようなもの)を数分で生成することができ、その後、薬としての有効性をさらに研究することができます。このセッションは、ウェット・ドライを統合した「未来のラボ」が、いかに創薬を真に計算科学的・技術的な追求に変えることができるかを例証するものでした。

一日を通して、AWS が AI/ML サービス、インフラ、実装リソースの最も包括的なセットで、創薬の旅のあらゆる段階で、あらゆる規模の企業をどのように支援しているかを強調するセッションが行われました。しかし、私たちにとって重要だったのは、セッション中に発表されたすべての内容を簡素化し、お客様にとって実用的なものにすることでした。そのために、セッション終了後に専門家に質問するネットワーキングエキスポを開催し、参加者は AWS の専門家と会い、私たちが提供するサービスの詳細なデモを見たり、明確な質問をしたりしました。

ライフサイエンス企業が機械学習を効果的に推進するために克服しなければならない最大の課題の一つは、 データの活用です。このため、シンポジウムでは「データへのアクセスと洞察の活用」をテーマにしたトラックも並行して開催し、マルチモーダルデータの効率的な保存、分析、カタログ化、共有のためのさまざまな目的別サービスとソリューションを紹介しました。データ・トラックのハイライトはこちらをご覧ください。

17 年前に AWS を立ち上げたとき、ライフサイエンスの研究者はクラウド導入の最前線にいました。今日、製薬会社のトップ 10 のうち 9 社がデータ分析や機械学習に AWS を使用しています。私たちのシンポジウムで業界のリーダーたちが団結するのを目の当たりにし、感銘を受けました。それは、私たちが“the art of the possible”(可能性の芸術)と呼ぶものの真の描写でした。

AWS が提供するライフサイエンス分野の包括的なサービスの詳細については、AWS for Life Sciencesのウェブサイトをご覧ください。AWS のスペシャリストと一対一でお客様のビジネスニーズについてご相談されたい場合は、こちらからお問い合わせください。

著者について

Lisa McFerrin

Lisa McFerrin

Lisa McFerrinは、Amazon Web Servicesの 研究、発見、トランスレーショナルメディシンのためのHealthcare and Lifesciencesチームの WW Lead です。Lisaは数学とコンピュータサイエンスのバックグラウンドを持ち、バイオインフォマティクスの博士号を取得しています。がん生物学の理解を深め、患者ケアを改善するために、生物医学データを橋渡しするソフトウェアと手法において15年以上の経験があります。共同研究や再現性のある研究を促進するため、データ解析の障壁を下げることに尽力しています。

Ujjwal Ratan

Ujjwal Ratan

Ujjwal Ratanは、Amazon Web ServicesのGlobal Healthcare and LifesciencesチームのPrincipal Machine Learning Specialistです。医療画像、非構造化臨床テキスト、ゲノミクス、精密医療、臨床試験、医療の質向上など、実世界の業界問題への機械学習と深層学習の応用に従事しています。AWSクラウド上での機械学習/ディープラーニングアルゴリズムのスケーリングに精通し、トレーニングや推論を高速化をおこなっています。趣味は音楽を聴くこと(および演奏すること)と、家族と計画を立てずにドライブ旅行をすることです。

翻訳は Solutions Architect の原田が担当しました。原文はこちらです。