Amazon Web Services ブログ
Tag: Amazon CloudWatch
ゾーンシフトを用いたクロスゾーン負荷分散
2024 年 11 月 22 日より、クロスゾーン負荷分散を有効にした Application Load Balancer (ALB) の Amazon Application Recovery Controller (ARC) ゾーンシフトサポートを発表しました。これは、以前に発表されたクロスゾーン負荷分散を使用する Network Load Balancer (NLB) のサポートを補完するものです。ゾーンシフトは、クロスゾーン負荷分散が設定されているかどうかに関係なく、NLB と ALB の両方で使用できるようになりました。この記事では、クロスゾーン負荷分散を有効にした状態でゾーンシフトを使用する場合の運用上のベストプラクティスを紹介します。
Amazon CloudWatch Logs Insights を用いたAmazon ECSライフサイクルイベントの効果的な分析
本記事では、Container Insights や Amazon EventBridge 、あるいはその両方を使用して、Amazon CloudWatch Logs Insights のクエリを通じて Amazon ECS のサービスイベントを効果的に分析する方法を紹介します。Container Insights は Amazon ECS のライフサイクルイベントを Amazon CloudWatch Log Group に保存することができ、イベントを遡って分析することが可能となり、運用効率が向上します。これにより、Amazon CloudWatch Logs Insights を使用したインシデント後の分析が可能になります。
【開催報告 & 資料公開】AWS 秋の Observability 祭り 2024
本ブログでは、2024 年 11 月 1 日に実施した「AWS 秋の Observability 祭り ~明日使えるアセット祭り~」のイベントについて内容を簡単にご紹介しつつ、アセット資料を紹介致します。今回のイベントでは、すぐデプロイできるアセットを活用し Observability の高度化をジャンプスタートすることをテーマに様々なアセットをご紹介しました。アセットは生成 AI を活用した Observability での障害分析の効率化 、負荷試験における可視化や異常検知といった Observability で試験の速度と品質の改善、Amazon CloudWatch をさらに高度に活用するためのネットワーク監視、ログ異常検知機能による運用改善と複数のユースケースをカバーしています。
Protective DNS サービスを活用した AWS ワークロードのセキュリティ強化
このブログでは、Protective DNS (PDNS) サービスを活用して AWS ワークロードのセキュリティを強化する方法を解説しています。PDNS がDNS 要求を分析し、ルールに基づいて応答を制御することで、ネットワークの基礎レベルからセキュリティを強化できることを説明します。また、AWS サービスとサードパーティの PDNS を組み合わせた具体的な実装例を紹介し、セキュリティ強化の実現方法を紹介します。
Amazon Bedrock Insights による CloudWatch アラームへの対応
クラウドで複雑な分散システムを運用する際、問題の原因を迅速に特定し、インシデントを解決することは大変な課題です。トラブルシューティングには、複数の AWS サービスからメトリクス、ログ、トレースをさらけずる必要があり、問題の全体像を把握することが難しくなります。しかし、この Alarm Context Tool (ACT) を使えば、効果的なインシデント解決に必要な時間と労力を削減できます。このブログでは、Amazon CloudWatch アラームに追加のコンテキストを提供する ACT ソリューションを紹介しています。ACT は、AWS Lambda 、Amazon CloudWatch 、AWS X-Ray 、AWS Health 、Amazon Bedrock を活用して、メトリクス、ログ、トレースを統合・分析し、有益な洞察を生成します。ACT を使えば、トラブルシューティングが簡素化され、運用コストを削減でき、AWS 環境の可観測性が向上します。
Failure Analysis Assistant – AIOps で障害分析を効率化してみよう –
システムやサービスを提供する上で、障害はつきものです。障害を迅速に分析し対処することがユーザビリティやサービス […]
Amazon CloudWatch アラームによる Amazon Connect API の利用状況監視
Amazon Connect では、高い通話量時に API 使用量が割り当てられた容量を超えると、顧客リクエストがスロットリングされ、パフォーマンスに影響が出る可能性があります。本記事では、Amazon CloudWatch を活用して Amazon Connect API の使用状況を監視し、使用量が設定した上限に近づいたときにアラートを受け取る方法を紹介します。これにより、パフォーマンス問題が発生する前に、アプリケーションの最適化や容量の追加などの対策を講じることができます。
アプリケーションの信頼性を効果的な SLO で向上させる
このブログでは、パフォーマンスを客観的に測定し、信頼性を正確に報告することで、インシデント発生時の迅速な対応と不要な警告を減らすことができる信頼性のベストプラクティスについて説明します。また、任意の Amazon CloudWatch メトリクスを使用して Amazon CloudWatch Application Signals で、サービスレベル目標(SLO)の作成、監視、アラートの方法を学びます。
Tomcat サーバー上で実行する Java アプリを Amazon CloudWatch Application Signals (プレビュー) で監視
このブログ記事では、WAR パッケージからデプロイされ、Tomcat サーバーで実行されている Java Web アプリケーションを Amazon CloudWatch Application Signals を使って自動的にインストルメンテーションする方法を紹介します。
Application Signals を有効にすることで、コールボリューム、可用性、レイテンシー、障害、エラーなどの主要メトリクスを利用して、アプリケーションサービスの現在の運用状態を迅速に確認してトリアージできるため、アプリケーションが長期的なパフォーマンスとビジネス上の目標を満たしているかを確認できます。
Python アプリのモニタリングを Amazon CloudWatch Application Signals (プレビュー) で実施
このブログ投稿では、Amazon EKS クラスター上で実行されている Python アプリケーションを、コード変更を行うことなくシームレスに計装するための CloudWatch Application Signals の活用方法について説明します。この強力な機能により、アプリケーションサービスのゴールデンメトリクスとトレースを簡単に収集でき、監視とトラブルシューティングが容易になることができます。さらに、Application Signals が提供する既製のダッシュボードを使うことで、アプリケーションサービスの全体の活動状況と運用の健全性をどのように視覚化できるかを説明します。これらのダッシュボードを活用することで、主要なパフォーマンスメトリクスにすばやくアクセスし、トレースと関連付けて、根本的な問題を数クリックで簡単に特定して対処できます。