透過主動監控、問題解決和資料驅動的洞察來最佳化 AWS 資源效能和可用性,從而實現順暢、高效且安全的雲端操作。
透過顯示資料以快速診斷問題的根本原因,縮短平均解析時間 (MTTR)。
整合容器和無伺服器服務之間的端對端可觀測性和分析,消除跨服務的繁瑣標記和事件關聯。
監控容器和無伺服器工作負載並進行疑難排解,以提高恢復能力和效率。例如,您可以利用 CloudWatch 中 AI 和 ML 支援的功能,使用自然語言查詢日誌和指標,分析模式和偵測異常,以及自動遮罩 CloudWatch Logs 中的敏感資料。
利用 Amazon Bedrock 和 Amazon CloudWatch 的功能,有效監控並最佳化生成式 AI 應用程式的效能。您可以使用 CloudWatch Container Insights 自動探索和監控 Amazon EKS 叢集中 NVIDIA GPU 的主要運作狀態指標,從而協助您掌握資源使用率、可用性和延遲。分析 CPU、記憶體、GPU 和網路指標以達到最佳化效率,並儘早識別潛在的瓶頸或異常狀況。
您可以透過使用 CloudWatch 儀表板和警示監控關鍵操作指標,例如執行持續時間、錯誤和節流,以此深入了解無伺服器應用程式的效能。此外,您可以使用 CloudWatch Logs Insights 分析日誌資料和分散式追蹤,以識別潛在的瓶頸。利用這些 CloudWatch 功能可讓您最佳化無伺服器架構,以降低成本和提升效率。
CloudWatch Container Insights 為 AWS Fargate、Amazon ECS 和 Amazon EKS 提供全面的運作狀態和效能指標,包括叢集、節點、服務和容器層級資料。您也可以整合 EKS 控制平面和 KubeState 指標,以分析和識別問題的根本原因。