Amazon DevOps Guru のよくある質問

全般

Amazon DevOps Guru は、アプリケーションの運用パフォーマンスと可用性の改善を容易にするように設計された、機械学習 (ML) を利用したサービスです。DevOps Guru は、通常の運用パターンから逸脱した動作を検出し、顧客に影響を与えるずっと前に運用上の問題を特定できます。DevOps Guru は、長年の Amazon.com と AWS の優れた運用によって通知された機械学習モデルを使用して、異常なアプリケーションの動作 (レイテンシーの増加、エラー率、リソースの制約など) を特定し、潜在的な停止やサービスの中断を引き起こす可能性のある重大な問題を明らかにします。DevOps Guru が重大な問題を特定すると、アラートを自動的に送信し、関連する異常の概要、および問題が発生した時期と場所に関するコンテキストを提供します。 可能な場合、DevOps Guru は、問題を修正する方法に関するレコメンデーションも提供するように設計されています。

Amazon DevOps Guru は、運用上の問題の検出、デバッグ、解決に費やす時間と労力を、数日、あるいは数時間節約できるように設計されています。これにより、複雑で進化を続けるアプリケーションを効果的にモニタリングできます。これにより、アプリケーションのダウンタイムの原因となる、アラームの欠落など、モニタリングにおける一般的な見落としやエラーを防ぐことができます。運用上の問題が発生した場合、DevOps Guru は、多数のデータソースから関連する特定の情報を取得することにより、デバッグ時間を節約します。DevOps Guru は、関連する異常の概要、問題が発生した理由とその時期に関するコンテキスト情報、および問題を修正してアプリケーションのダウンタイムを削減する方法に関するレコメンデーションとともに、問題のアラートを発信する運用インサイトを生成します。

Amazon DevOps Guru の ML モデルは、Amazon.com のための高可用性アプリケーションの構築、スケール、メンテナンスにおける 20 年緒の運用上の専門知識から恩恵を受けています。DevOps Guru は、すべてのリソースのレイテンシー、エラー率、リクエスト率などのメトリクスを自動的に取り込み、分析して、通常の運用範囲を確立するように設計されています。次に、DevOps Guru は、事前にトレーニングされた機械学習モデルを使用して、確立されたベースラインからの逸脱を特定します。レイテンシーの増加、エラー率、リソースの制約など、潜在的な停止やサービスの中断を引き起こす可能性のあるアプリケーションの異常な動作を特定すると、関係するリソース、問題のタイムライン、その他の関連イベントなどの詳細問題を運営者に警告し、問題の潜在的な影響と考えられる原因をすばやく理解できるようにします。また、修復や軽減といったオプションも提供するように設計されています。デベロッパーは、DevOps Guru からの提案を使用して、問題が発生したときに解決までにかかる時間を短縮し、手動での構成セットアップや機械学習の専門知識を必要とすることなく、アプリケーションの可用性と信頼性を向上させることができます。DevOps Guru はスタンドアロンサービスとして使用でき、AWS System Manager OpsCenter とともに PagerDuty および Atlassian のパートナーアプリケーションとも統合できます。

数回クリックするだけで、AWS マネジメントコンソールで Amazon DevOps Guru を有効にできます。DevOps Guru は、AWS リソースの分析カバレッジをすばやく構成する際に役立つオンボーディングウィザードを提供します。有効にすると、DevOps Guru は選択に基づいて AWS リソースの運用データを継続的に分析し、進行中または緊急の運用上の問題を検出するたびにインサイトを生成するように設計されています。

分析カバレッジの境界を AWS アカウント全体として選択することも、DevOps Guru に分析させる特定の AWS CloudFormation スタックを指定することも、AWS タグを使用して DevOps Guru に分析させるリソースグループを作成することもできます。選択に基づいて、DevOps Guru は、選択したカバレッジ境界でサポートされているすべての AWS リソースの運用データを分析します。

カバレッジ境界の選択に新しいリソースを追加すると、DevOps Guru は追加リソースの分析を自動的に開始します。同様に、DevOps Guru は、アカウントまたは CloudFormation スタックからリソースを削除すると、リソースの分析と請求を停止します。

Amazon DevOps Guru は、アラームの欠落や設定ミス、リソース枯渇の早期警告、停止につながる可能性のあるコードと設定の変更などの運用上の問題を自動的に検出するように設計されています。DevOps Guru は、機械学習を使用してメトリクスとログの異常を運用イベントと相関させ、適切な修復手順に専念できるコンテキストインサイトを提供します。DevOps Guru は、ウェブアプリケーションのレイテンシーの急増、ディスクスペースの不足、不正なコードのデプロイ、メモリリークなど、関連するアプリケーションやインフラストラクチャのメトリクスを相関させてグループ化し、誤ったアラームや冗長なアラームを減らして、重要度の高い問題に注力できるようにします。

起動時に、Amazon DevOps Guru は、Amazon CloudWatch、AWS Config、AWS System Manager OpsCenter、AWS CloudFormation、AWS X-Ray からのデータを使用できます。Amazon DevOps Guru は、Atlassian OpsGenie や Pager Duty などのパートナー運用モニタリングおよびインシデント管理ソリューションとも統合されています。

AWS Systems Manager OpsCenter をご使用の場合、Amazon DevOps Guru Operational Insights を OpsCenter ダッシュボード内に OpsItems として直接表示できます。

Amazon DevOps Guru は、転送中および保管中の暗号化を使用して、取り込みおよびデータ分析中にコンテンツを保護します。

トレーニングデータは、AWS の内部サービスとインフラストラクチャによって生成されました。 

Operational Insights

Amazon DevOps Guru Operational Insights は、DevOps Guru コンソールで運用上の問題を直接調査および是正するために必要な情報を集約します。インサイトは、3 つの主要なセクションで構成されています。システムとアプリケーションの異常な動作を簡単に視覚化するためのグラフを使用して、運用上の問題に関連する異常なメトリクスとログを強調表示します。インサイトには、関連するイベントやログスニペットなどのコンテキスト情報も含まれているため、範囲を簡単に理解してタイムラインを発行できます。Operational Insights には、問題を修正するために実行できるアクションに関するレコメンデーションも含まれています。

Amazon DevOps Guru を設定して、AWS Systems Manager OpsCenter で生成されるインサイトごとに OpsItem を作成できます。また、AWS SNS を介してインサイトを提供するように DevOps Guru を構成することもできます。これは、PagerDuty や Atlassian などのインシデント管理ツールに利用できます。

有効にすると、Amazon DevOps はアプリケーションのベースライン化を開始します。これは、分析されるリソースの数に応じて数分から 1 時間の範囲になります。ベースライン化の後、DevOps Guru はリソースを継続的に分析し、異常な動作を検出すると、インサイトを生成します。

DevOps Guru for RDS

 Amazon DevOps Guru for RDS は、データベース内のパフォーマンスと運用上の問題を自動的に検出および診断するように設計された、Amazon DevOps Guru の ML を利用した機能です。これを利用することで、デベロッパーは、数日かかっていた問題を数分以内に解決できます。DevOps Guru for RDS は、DevOps Guru の機能を拡張して、リソースの過剰使用や特定の SQL クエリの誤動作など、Amazon RDS のさまざまなデータベース関連の問題を検出、診断、および修正します。問題が発生すると、Amazon DevOps Guru for RDS はすぐにデベロッパーに通知し、診断情報、問題の範囲の詳細、およびお客様がデータベースに関するパフォーマンスのボトルネックと運用上の問題を迅速に解決するのに役立つインテリジェントな修復についてレコメンデーションを提供します。

Amazon DevOps Guru for RDS は、手動作業を行わずに、時間 (数時間から数日かかっていたものを数分に) を短縮して、リレーショナルデータベースのワークロードで見つけにくいパフォーマンスのボトルネックを検出して解決するように設計されています。すべての Amazon Aurora と Amazon RDS for PostgreSQL データベースで DevOps Guru for RDS を有効にすると、ワークロードのパフォーマンスの問題が自動的に検出されます。その後、各問題についてアラートが送信され、検出結果の説明が提供され、問題を解決するためのアクションが推奨されます。DevOps Guru for RDS を使用すれば、専門家以外のユーザーがデータベースを管理しやすくなり、データベースの専門家がさらに多くのデータベースを管理できるように支援します。

Amazon DevOps Guru for RDS は、Amazon RDS Performance Insights (PI) によって収集されたテレメトリデータを分析します。DevOps Guru for RDS がデータベースに保存されているデータを分析で使用することはありません。DevOps Guru for RDS は、ルールと ML ベースの手法を組み合わせて PI テレメトリにおける問題のあるパターンを探し、そのようなパターンが検出されるとユーザーに警告します。

使用を開始するには、Amazon RDS コンソールで Amazon RDS Performance Insights をオンにし、Amazon DevOps Guru コンソールに移動して、Amazon Aurora リソース、他のサポートされたリソース、またはアカウント全体のためにサービスを有効にします。また、Amazon RDS コンソール内から新しいデータベースを作成もしくはモニタリングする際に、Amazon Aurora データベースに対して Amazon DevOps Guru for RDS を有効にすることができます。さらに、Performance Insights (PI) ページ、もしくはデータベース詳細のページ内から Amazon DevOps Guru for RDS を有効にするオプションも用意されています。 DevOps Guru を使用すれば、分析カバレッジの境界を AWS アカウント全体として選択することも、DevOps Guru に分析させる特定の AWS CloudFormation スタックを指定することも、AWS タグを使用して DevOps Guru に分析させるリソースグループを作成することもできます。

Amazon DevOps Guru for RDS は、ロックパイルアップ、接続ストーム、SQL リグレッション、CPU と I/O の競合、メモリの問題、誤って設定されたパラメータなど、アプリケーションサービスの質に影響を及ぼす可能性のあるさまざまなパフォーマンスの問題を特定するよう設計されています。

Amazon RDS Performance Insights は、Amazon RDS データベースパフォーマンスメトリクスを収集し、その視覚的な表現を提示するデータベースパフォーマンスのチューニングとモニタリングを行う機能で、データベースの状態をすばやく評価し、いつどこに措置を講じたらよいかを判断するのに役立ちます。Amazon DevOps Guru for RDS は、これらのメトリクスをモニタリングし、データベースでパフォーマンスの問題が発生していることを検出します。さらに、メトリクスを分析して、何が問題で、何ができるかを通知します。

DevOps Guru for Serveless

Amazon DevOps Guru for Serverless は、AWS リソースを使用して構築されたサーバーレスアプリケーションのパフォーマンスと運用上の問題を自動的に検出および診断するために設計された、Amazon DevOps Guru の ML を活用した新機能です。DevOps Guru for Serverless は、DevOps Guru の機能を拡張し、サーバーレスアプリケーションの検出、診断、改善策の推奨 (例えば、パフォーマンスのレイテンシー劣化、リソースの枯渇など) を行います。アプリケーションに影響を与える進行中の問題に対してリアクティブインサイトを提供し、より迅速にそれらを解決できるようにします。さらに、アプリケーションやインフラストラクチャの潜在的な問題に早期にフラグを立てるプロアクティブインサイトを提供し、より迅速な対応とダウンタイムの短縮、運用コストの削減を可能にします。

Amazon DevOps Guru for Serverless を利用することで、サーバーレスアプリケーションのパフォーマンスと運用上の問題をモニタリングできます。手動でのセットアップや機械学習の専門知識、深いサーバーレスの専門知識は必要ありません。このサービスは、サーバーレスアプリケーションの見つけにくい信頼性、パフォーマンス、運用上の問題を検出し、解決するまでの時間を短縮 (数時間から数分へ) するように設計されています。また、DevOps Guru for Serverless は、アプリケーションに影響を与え得る潜在的な問題を早期に検出し、ユーザーに影響を与える前に問題を軽減することができます。

Amazon DevOps Guru for Serverless は、サーバーレスアプリケーションのすべてのリソースのメトリクスとログを自動的に取り込んで分析し、通常の運用範囲を確立し、確立したベースラインからの逸脱を検出します。DevOps Guru は、アプリケーションが異常な状態にあることを特定すると、関係するリソース、問題のタイムライン、関連するイベントなどの関連する詳細とともに問題のオペレーターに通知し、問題の潜在的な影響と考えられる原因を迅速に理解できるよう支援します。また、修復や軽減といったオプションも提供するように設計されています。

サーバーレスアプリケーションのために AWS アカウントで Amazon DevOps Guru を有効にすると、数回のクリックで、サーバーレスアプリケーションのモニタリングを開始できます。A: カバレッジの境界を AWS アカウント全体に設定することも、特定の AWS CloudFormation スタックを指定することも、AWS タグを使用して DevOps Guru に分析させるリソースグループを作成することもできます。

DevOps Guru for Serverless は、ML を使用してメトリクスとログの異常を運用イベントと相関させ、適切な是正ステップに注力するのに役立つ、コンテキストに基づいたインサイトを提供します。また、DevOps Guru for Serverless は潜在的な問題を早期に検出するため、アプリケーションに影響を与える前に問題を軽減することができます。プロアクティブインサイトには、3 つのタイプがあります:

  • リソースのセットアップ: Amazon DevOps Guru for Serverless は、アプリケーションに AWS のベストプラクティスに従わないリソースのセットアップがあることを検出します。例えば、API ゲートウェイのエンドポイントを持つ Lambda ベースのアプリケーションを考えてみましょう。Lambda 関数には、現在プロビジョンされている関数の同時実行性を超える呼び出しがあります。これにより、リクエストが継続的に波及し、コールドスタートが発生し、その結果、レイテンシーが低下し、コストが上昇する可能性があります。DevOps Guru はこの問題を検出し、Lambda関数のプロビジョンされた同時実行数を増やすことを積極的に推奨しています。
  • リソースの枯渇: Amazon DevOps Guru for Serverless は、アプリケーションの使用傾向に基づいて、一部のリソースが限界に達するリスクがあることを検出します。例えば、ある Elastic Search ノードでは、ゆっくりとしたメモリリークがあり、それが着実に増加しています。DevOps Guru はこれを検出し、メモリがまもなく最大容量の限界に達することを予測し、メモリの蓄積を修正することを推奨するプロアクティブインサイトを作成します。
  • リソースの利用状況: Amazon DevOps Guru for Serverless は、アプリケーションに十分に活用されていないリソースがあることを検出します。例えば、アプリケーションの DynamoDB は、実際に消費される量を大幅に超える書き込み容量単位をプロビジョニングしています。DevOps Guru はこれを検出し、DynamoDB のプロビジョニングされた書き込み容量をスケールバックするよう推奨します。

Amazon DevOps Guru for Serverless は、レイテンシーの増大、5xx エラーなど、アプリケーションに影響を及ぼす継続的な問題についてのリアクティブインサイトを提供し、それらを迅速に解決できるようにします。Amazon DevOps Guru for Serverless は、アプリケーションやインフラストラクチャの潜在的な問題に早期にフラグを立てるプロアクティブインサイトを提供し、迅速に対応しコストのかかるダウンタイムや運用コストを削減することができます。

料金と請求

Amazon DevOps Guru では、使用した分の料金のみをお支払いいただきます。初期費用や最低利用料金はかかりません。DevOps Guru を有効にし、監視するアプリケーションを指定すると、DevOps Guru はこれらのアプリケーションが使用するリソースの運用データの分析を開始します。請求を決める 2 つのコンポーネントには、AWS リソース分析の料金と DevOps Guru API 呼び出しの料金があります。詳細については、料金ページをご覧ください。

DevOps Guru によって分析された AWS リソースタイプ (Amazon S3 バケット、Amazon EC2 インスタンスなど) は、2 つの料金グループに分類されます。特定の AWS リソースタイプについて請求される料金は、料金グループ (A または B) によって異なります。

いいえ。アクティブなリソースごとに、分析された AWS リソース時間についての料金をお支払いいただきます。リソースは、1 時間以内にメトリクス、イベント、またはログエントリを生成する場合にのみアクティブになります。

DevOps Guru は、25 を超える異なる AWS リソースタイプ (Amazon S3 バケット、Amazon EC2 インスタンスなど) を分析します。追加のリソースタイプのサポートも間もなく開始予定です。

分析のために特定の AWS リソースを選択する代わりに、リソース分析のカバレッジ境界を指定します。選択に基づいて、DevOps Guru は、カバレッジ境界でサポートされているすべての AWS リソースの運用データを分析します。アカウント全体、または特定の AWS CloudFormation スタックを選択するか、AWS タグを使用して、DevOps Guru がカバレッジの境界として分析するリソースグループを作成できます。カバレッジ境界 (アカウントまたは CloudFormation スタック) に新しいリソースを追加すると、DevOps Guru は追加リソースの分析を自動的に開始します。同様に、DevOps Guru は、DevOps Guru が分析しているアカウントまたは CloudFormation スタックからリソースを削除すると、リソースの分析と請求を停止します。

Amazon DevOps Guru for RDS は、DevOps Guru が RDS リソースについてお客様に請求する既存の料金の一部として提供されます。追加料金はかかりません。 DevOps Guru は、評価するリソースタイプを 2 つのグループに分けます。グループ A には AWS Lambda と Amazon S3 が含まれ、グループ B には Amazon RDS、Amazon EC2、Amazon Redshift クラスター、およびその他の AWS リソースタイプ 25 種が含まれます。グループ A の料金は、リソースあたり毎時間 0.0028 USD です (30 日で計算すると各リソースに対して約 2 USD です)。グループ B の料金は、リソースあたり毎時間 0.0042 USD です (30 日で計算すると各リソースに対して約 3 USD です)。詳細については、料金ページをご覧ください。

DevOps Guru コスト見積もりツールを使用して、リソース分析料金を知ることができます。選択したリソースをスキャンして、毎月のコスト見積もりを作成します。コスト見積もりのデフォルトでは、分析されたアクティブなリソースが時間の 100% 分使用されていると想定しています。推定使用量に基づいて分析したサービスごとにこの割合を変更して、更新された月額コスト見積もりを作成できます。

DevOps Guru イベントに関する通知を受信するように Amazon Simple Notification Service (SNS) を設定すると、Amazon SNS の標準料金に基づいて追加料金が発生します。同様に、DevOps Guru インサイトの OpsItem を受け取るように設定すると、AWS Systems Manager の標準料金ごとに追加料金が発生します。

はい。AWS 無料利用枠には、リソースグループ A と B それぞれについて 7,200 AWS リソース時間の DevOps Guru 分析と、3 か月間で 10,000 件/月の DevOps Guru API コールの使用が含まれています。

Amazon DevOps Guru は、米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (北カリフォルニア)、米国西部 (オレゴン)、カナダ (中部)、欧州 (フランクフルト)、欧州 (アイルランド)、欧州 (ストックホルム)、欧州 (ロンドン)、欧州 (パリ)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、南米 (サンパウロ)、アジアパシフィック (シンガポール)、アジアパシフィック (シドニー)、アジアパシフィック (東京) の各 AWS リージョンでご利用いただけます。また、その他のリージョンでも近日中にご利用いただけるようになる予定です。AWS リージョンサービス一覧もご覧いただけます。