Amazon Web Services ブログ
Category: Management & Governance
Amazon Bedrock Agents と Amazon CloudWatch Logs を使用した、生成 AI によるクラウド運用ワークフローの実現
このブログ記事では、AWS のクラウド運用シナリオにおいて、アプリケーションログファイルで観察されたエラーに基づいて問題を分類し、その後解決するために、Amazon Bedrock エージェントと Bedrock の FM を使用した 生成 AI の使用例を紹介します。
我々のソリューションでは、Amazon Bedrock エージェントは基盤モデル (FM) の推論の性能を使用して、CloudWatch Logs に公開されたアプリケーションログについてのエラー解決を要求するユーザー指示を複数のステップに分解します。開発者/アナリストが提供した自然言語の指示を使用してオーケストレーション計画を作成し、その後、関連する API を呼び出し、Amazon Bedrock Knowledge Base にアクセスすることで計画を実行します。これには、大規模言語モデル (LLM) によって生成された応答を補強するために、ベクトルデータストア (Amazon OpenSearch Serverless) から情報を引き出す処理が含まれます。
Amazon CloudWatch Logs Data Protection による機密ログデータの検出と保護
Amazon Web Services (AWS) 上で実行されるお客様のアプリケーションでは、個人を特定できる情報 (PII) や保護された健康情報 (PHI) などの機密データを扱う必要がある場合があります。
その結果、機密ログデータがアプリケーションの可観測性データの一部として意図的または意図せずに記録される可能性があります。包括的なログ記録はアプリケーションのトラブルシューティング、監視、(原因)分析に重要ですが、記録された機密情報はデータセキュリティとコンプライアンスの観点から重大なリスクとなります。このブログでは、Amazon CloudWatch Logs Data Protection を使用してログ内の機密データを検出および保護する方法、データ保護を検証する方法、非準拠の結果を収集および報告する方法を学びます。また、Amazon CloudWatch アラーム、通知、さらなる是正アクションを作成する方法についても学び、コンプライアンス要件を満たすために活用方法をご紹介します。
AWS Resilience Hub の 標準作業手順 (SOP) を自動実行する
AWS Resilience Hub は AWS マネジメントコンソール上でアプリケーションの回復力(レジリエ […]
Amazon Bedrock Insights による CloudWatch アラームへの対応
クラウドで複雑な分散システムを運用する際、問題の原因を迅速に特定し、インシデントを解決することは大変な課題です。トラブルシューティングには、複数の AWS サービスからメトリクス、ログ、トレースをさらけずる必要があり、問題の全体像を把握することが難しくなります。しかし、この Alarm Context Tool (ACT) を使えば、効果的なインシデント解決に必要な時間と労力を削減できます。このブログでは、Amazon CloudWatch アラームに追加のコンテキストを提供する ACT ソリューションを紹介しています。ACT は、AWS Lambda 、Amazon CloudWatch 、AWS X-Ray 、AWS Health 、Amazon Bedrock を活用して、メトリクス、ログ、トレースを統合・分析し、有益な洞察を生成します。ACT を使えば、トラブルシューティングが簡素化され、運用コストを削減でき、AWS 環境の可観測性が向上します。
AWS オブザーバビリティの向上 – Amazon CloudWatch アラームの力を引き出そう
この記事では、CloudWatch アラームを使用した信頼性の高いモニタリングのための重要なヒントと戦略について説明します。アラームの推奨事項の一般的なユースケースを説明し、欠落データのシナリオや警告を早期に発する設定など、具体的なユースケースについて詳しく説明します。
AWS とマルチクラウド: 既存の機能と継続的な機能強化
AWS の大規模なお客様にそれぞれの課題や懸念事項について話すとき、会話のトピックがマルチクラウドに変わること […]
Failure Analysis Assistant – AIOps で障害分析を効率化してみよう –
システムやサービスを提供する上で、障害はつきものです。障害を迅速に分析し対処することがユーザビリティやサービス […]
AWS Supply Chain は ESG データコンプライアンスを簡素化します
組織は、広大なグローバルサプライチェーンを横断してサステナビリティコンプライアンスを維持するという複雑な課題に […]
アプリケーションの信頼性を効果的な SLO で向上させる
このブログでは、パフォーマンスを客観的に測定し、信頼性を正確に報告することで、インシデント発生時の迅速な対応と不要な警告を減らすことができる信頼性のベストプラクティスについて説明します。また、任意の Amazon CloudWatch メトリクスを使用して Amazon CloudWatch Application Signals で、サービスレベル目標(SLO)の作成、監視、アラートの方法を学びます。
AWS Resilience Hub を使用して耐障害性ドリフトを検出する
多くの場合ディザスタリカバリは大きなイベントからアプリケーションを保護するメカニズムだと考えられています。しか […]