ความแตกต่างระหว่างข้อมูลการสังเกตและการติดตามตรวจสอบคืออะไร
ข้อมูลการสังเกตและการติดตามตรวจสอบใน DevOps เป็นกระบวนการที่ใช้ข้อมูลที่แตกต่างกัน 2 กระบวนการ คุณสามารถใช้บริการเหล่านี้เพื่อรักษาและจัดการความสมบูรณ์และประสิทธิภาพของสถาปัตยกรรมไมโครเซอร์วิสแบบกระจายและโครงสร้างพื้นฐานของสถาปัตยกรรมไมโครเซอร์วิสแบบกระจายได้ ระบบแบบกระจายจะทำงานโดยการแลกเปลี่ยนข้อมูลระหว่างส่วนประกอบต่าง ๆ หลายสิบถึงหลายร้อย หรืออาจหลายพันรายการ
การติดตามตรวจสอบเป็นกระบวนการรวบรวมข้อมูลและสร้างรายงานเกี่ยวกับเมตริกต่าง ๆ ที่กำหนดความสมบูรณ์ของระบบ ส่วนข้อมูลการสังเกตค่อนข้างเป็นวิธีในการสืบสวนมากกว่า โดยจะพิจารณาอย่างใกล้ชิดที่การโต้ตอบของส่วนประกอบระบบแบบกระจายและข้อมูลที่รวบรวมโดยการตรวจสอบเพื่อค้นหาสาเหตุของปัญหา ซึ่งประกอบด้วยกิจกรรมต่าง ๆ เช่น การวิเคราะห์เส้นทางการติดตาม ซึ่งเป็นกระบวนการที่ติดตามเส้นทางของคำขอผ่านระบบเพื่อระบุความล้มเหลวในการรวมระบบ การติดตามตรวจสอบจะรวบรวมข้อมูลในแต่ละองค์ประกอบ และข้อมูลการสังเกตจะดูที่ระบบแบบกระจายโดยรวม
วิธีการทำงานระหว่างข้อมูลการสังเกตและการติดตามตรวจสอบ
ข้อมูลการสังเกตและการตรวจสอบเป็นกระบวนการสำคัญในการเรียกใช้โปรแกรม DevOps ที่มีประสิทธิภาพ
การตรวจสอบ
การตรวจสอบระบบคอมพิวเตอร์เป็นแนวทางปฏิบัติที่เก่าพอ ๆ กับการเรียกใช้ระบบคอมพิวเตอร์ กระบวนการติดตามตรวจสอบจะรวบรวมข้อมูลเกี่ยวกับระบบเพื่อตรวจสอบว่าระบบนั้นสามารถทำงานตามที่คาดไว้ได้หรือไม่ ซึ่งจะประกอบไปด้วยรายงานและการแจ้งเตือนเกี่ยวกับข้อผิดพลาด ข้อบกพร่อง หรือค่าข้อมูลที่ผิดปกติ
ตัวอย่างเช่น เครื่องมือติดตามตรวจสอบสามารถรวบรวมข้อมูลเพื่อตรวจวัดเวลาที่ใช้ในการปรับใช้การเปิดตัวแอปพลิเคชันได้ หากเวลาที่ใช้นั้นอยู่นอกกรอบเวลาที่คาดหวังไว้ เครื่องมือติดตามตรวจสอบจะสามารถแจ้งเตือนให้กับผู้ใช้ได้ โดยระบุว่ามีบางอย่างผิดปกติเกิดขึ้น
การติดตามตรวจสอบ DevOps จะครอบคลุมไปถึงวงจรชีวิตการพัฒนาซอฟต์แวร์แบบเต็มรูปแบบ (SDLC) การตรวจสอบประสิทธิภาพของแอปพลิเคชัน (APM) เป็นส่วนย่อยเฉพาะของการติดตามตรวจสอบ DevOps ที่เน้นไปที่แอปพลิเคชันที่ทำงานในการผลิต ซึ่งจะจัดลำดับความสำคัญของเมตริกที่ใช้กับประสบการณ์ผู้ใช้เป็นอันดับแรก
อ่านบทความเกี่ยวกับวงจรการพัฒนาซอฟต์แวร์
อ่านข้อมูลเกี่ยวกับการติดตามตรวจสอบประสิทธิภาพของแอปพลิเคชัน
การสังเกตการณ์
ข้อมูลการสังเกตจะทำให้ได้รับขอบเขตและการมองเห็นที่กว้างขึ้นสำหรับเครื่องมือติดตามตรวจสอบแบบดั้งเดิม โดยจะผสมผสานข้อมูลสถานการณ์และประวัติเพิ่มเติมและการโต้ตอบของระบบ ช่วยให้สามารถตรวจสอบสาเหตุที่แท้จริงของการแจ้งเตือนการติดตามตรวจสอบ ควบคู่ไปกับความสามารถในการตรวจสอบปัญหาที่เกิดขึ้นเนื่องจากการโต้ตอบหลายองค์ประกอบ
คุณสามารถใช้เครื่องมือสังเกตเพื่อดีบักระบบที่ใช้สถาปัตยกรรมแอปพลิเคชันแบบกระจายได้ด้วยตนเอง นอกจากนี้ คุณยังสามารถใช้สิ่งเหล่านี้เพื่อสังเกตความสมบูรณ์ของระบบโดยรวมแบบเรียลไทม์และการโต้ตอบระหว่างส่วนประกอบของระบบได้อีกด้วย คุณสามารถใช้ซอฟต์แวร์ข้อมูลการสังเกตเพื่อเชื่อมโยงระบบที่เชื่อมต่อถึงกันทั้งหมด รวมถึงการพึ่งพากันของระบบ และการโต้ตอบแบบเรียลไทม์ได้
ความคล้ายคลึงกันระหว่างข้อมูลการสังเกตและการติดตามตรวจสอบคืออะไร
ทั้งข้อมูลการสังเกตและการติดตามตรวจสอบนั้นมีต้นกำเนิดมาจากสาขาทฤษฎีการควบคุม วิศวกรรมระบบ และฟิลด์ทางคณิตศาสตร์ มีการใช้งานคุณสมบัติทั้ง 2 แบบอย่างแพร่หลายทั่วทั้งการประมวลผลและสภาพแวดล้อมทางกายภาพที่ผสมผสานการประมวลผลเพื่อบำรุงรักษาสถานะประสิทธิภาพและประสิทธิภาพของระบบ ใน DevOps คำต่าง ๆ มักจะใช้แทนกันได้ เนื่องจากทั้งสองคำเกี่ยวข้องกับข้อมูลการวัดและส่งข้อมูลทางไกล เช่น หน่วยวัด เหตุการณ์ ข้อมูลบันทึก และการตามรอย
ตัววัด
เมตริกคือการวัดข้อมูลระบบ ตัวอย่างเช่น เมตริกอาจเป็นอัตราการโอนถ่ายข้อมูลของเครือข่ายหรือจำนวนข้อผิดพลาดของแอปพลิเคชันภายในหนึ่งสัปดาห์ การติดตามตรวจสอบจะรายงานเกี่ยวกับตัวเมตริก และข้อมูลการสังเกตจะมองหาวิธีปรับปรุงค่าของเมตริกเหล่านั้น
เหตุการณ์
เหตุการณ์คือการดำเนินการที่เกิดขึ้นในระบบ ณ เวลาใดเวลาหนึ่ง ตัวอย่างอาจเป็นผู้ใช้เปลี่ยนรหัสผ่านหรือการแจ้งเตือนที่ระบุว่ามีการพยายามใช้รหัสผ่านเป็นจำนวนมาก เหตุการณ์จะกระตุ้นให้เกิดการติดตามตรวจสอบและรองรับข้อมูลการสังเกตในการสืบสวนเหตุการณ์
ข้อมูลบันทึก
ข้อมูลบันทึกคือไฟล์ที่สร้างโดยซอฟต์แวร์ซึ่งมีข้อมูลเกี่ยวกับการดำเนินงาน กิจกรรม และรูปแบบการใช้งานของระบบ ซึ่งรวมถึงบันทึกประวัติของกระบวนการ เหตุการณ์ และข้อความทั้งหมดพร้อมกับข้อมูลเชิงอธิบายเพิ่มเติม เช่น การประทับเวลา เพื่อทำให้ข้อมูลนี้มีบริบท การติดตามตรวจสอบจะสร้างข้อมูลบันทึกที่ข้อมูลการสังเกตใช้สำหรับการวิเคราะห์ระบบเพิ่มเติม
การตามรอย
การตามรอยคือเส้นทางเต็มของการดำเนินการเดียวในระบบที่เกี่ยวข้องซึ่งกันและกัน สำหรับการตามรอยแบบกระจายอย่างสมบูรณ์ จำเป็นต้องมีการส่งสัญญาณจากทุกธุรกรรมในสถาปัตยกรรมไมโครเซอร์วิสเพื่อตามรอย การติดตามตรวจสอบจะช่วยให้สามารถตามรอยได้ ซึ่งเป็นหน้าที่สำคัญของข้อมูลการสังเกต
ข้อมูลการสังเกตและการติดตามตรวจสอบ: ความแตกต่างที่สำคัญ
การติดตามตรวจสอบเป็นองค์ประกอบหลักที่สำคัญของข้อมูลการสังเกต การติดตามตรวจสอบที่ครอบคลุมจะสร้างเมตริก เหตุการณ์ ข้อมูลบันทึก และการตามรอยที่มีนัยสำคัญที่จะวัดสิ่งที่จำเป็นในลักษณะที่สามารถระบุตัวตนและเรียกคืนได้ง่าย บันทึกในอดีตจะถูกจัดเก็บควบคู่ไปกับการวัดในปัจจุบันเพื่อสร้างภาพรวมของระบบในระดับต่าง ๆ ข้อมูลการสังเกตสามารถใช้สิ่งที่การตรวจสอบสร้างขึ้นเพื่อตรวจสอบเหตุการณ์ได้ลึกยิ่งขึ้น
การติดตามตรวจสอบคือเวลาและลักษณะของข้อผิดพลาดของระบบ ส่วนข้อมูลการสังเกตคือสาเหตุและวิธีการ มีสัญญาณมากมายในการวางแผนและตรวจสอบเพื่อให้ได้ภาพรวมของสถานะภายในและประสิทธิภาพของระบบทั้งหมด คุณต้องจำเป็นต้องมีข้อมูลทั้งหมดนี้เพื่อให้สามารถดำเนินการสืบสวนได้อย่างมีประสิทธิภาพ เพื่อให้ข้อมูลการสังเกตมีประโยชน์และมีประสิทธิผล การติดตามตรวจสอบจะต้องมีความครอบคลุมและมีคำอธิบาย
ความผิดปกติ
เมื่อใช้ระบบการติดตามตรวจสอบ คุณจะสามารถค้นพบความผิดปกติหรือพฤติกรรมที่ผิดปกติในสถานะและประสิทธิภาพของระบบได้ เมื่อใช้ข้อมูลการสังเกต คุณจะสามารถตรวจสอบความผิดปกติเพิ่มเติมได้ แม้ว่าจะเกิดขึ้นเนื่องจากการโต้ตอบระหว่างส่วนประกอบบริการหลายร้อยรายการก็ตาม
สาเหตุและผลกระทบ
การติดตามตรวจสอบจะมุ่งเน้นไปที่การวัดค่าบางอย่างเพื่อดูว่ามีผลกระทบต่อระบบหรือไม่ เป้าหมายของข้อมูลการสังเกตคือการเข้าใจสาเหตุของผลกระทบดังกล่าว ตัวอย่างเช่น เมื่อมีการเผยแพร่โค้ดใหม่ การติดตามตรวจสอบจะติดตามการวัดผลของระบบเพื่อดูว่าเวลาในการโหลดแอปพลิเคชันหรือเวลาในการดึงข้อมูลได้รับผลกระทบจากการเปลี่ยนแปลงหรือไม่ ในกรณีที่มีผลกระทบ ข้อมูลการสังเกตจะตรวจสอบเหตุผลหรือสาเหตุ โดยจะตอบคำถามได้ว่าส่วนใดของการเปลี่ยนแปลงโค้ดที่ทำให้เกิดผลกระทบพร้อมนำเสนอวิธีแก้ไข
การโต้ตอบของระบบ
โดยทั่วไปแล้วการติดตามตรวจสอบจะวัดความสมบูรณ์ของระบบโดยเฉพาะ โดยรวบรวมข้อมูลเกี่ยวกับส่วนประกอบต่าง ๆ ของระบบทั้งหมด แต่ข้อมูลอาจถูกแยกออกจากกัน และอาจจะเข้าใจถึงความสัมพันธ์กันของข้อมูลได้ยาก เมื่อใช้ข้อมูลการสังเกต คุณจะได้รับมุมมองโดยรวมของระบบที่เกี่ยวข้องกันทั้งหมด เพื่อทำความเข้าใจว่าปัญหาเกิดขึ้นที่ไหนและเกิดขึ้นอย่างไร
เมื่อใดที่ควรใช้ข้อมูลการสังเกตเทียบกับการติดตามตรวจสอบ
การตรวจจับข้อผิดพลาดย้อนหลัง เช่น การเรียนรู้การหยุดทำงานจากผู้ใช้หรือการค้นหาแอปพลิเคชันที่ทำงานบนระบบเป้าหมายที่ไม่ถูกต้อง อาจส่งผลให้สูญเสียเวลา เงิน ชื่อเสียง และทรัพยากรของนักพัฒนา การติดตามตรวจสอบเป็นสิ่งจำเป็นสำหรับการตรวจจับข้อผิดพลาดเชิงรุก เครื่องมือติดตามตรวจสอบจะเพิ่มการแจ้งเตือนสำหรับความคลาดเคลื่อนทุกประเภทที่คุณสามารถระบุและแก้ไขได้ก่อนที่จะก่อให้เกิดผลกระทบระยะยาว
ระบบที่สังเกตได้จะเพิ่มความสามารถในการติดตามตรวจสอบที่มีอยู่ จำเป็นอย่างยิ่งในการเรียกใช้สถาปัตยกรรมแอปพลิเคชันไมโครเซอร์วิส โดยเฉพาะอย่างยิ่งเมื่อมีการปรับใช้กับโครงสร้างพื้นฐานคลาวด์แบบกระจาย เมื่อใช้การติดตามตรวจสอบเพียงอย่างเดียว มันแทบจะเป็นไปไม่ได้เลยที่จะระบุและแยกแอปพลิเคชันหรือบริการที่ข้อผิดพลาดเริ่มต้นขึ้น การจับและติดตามข้อมูลที่ถูกต้อง ควบคู่ไปกับข้อมูลการสังเกต ทำให้คุณสามารถติดตามข้อผิดพลาดผ่านระบบที่ซับซ้อนได้
สรุปความแตกต่างระหว่าง การติดตามตรวจสอบกับข้อมูลการสังเกต
การตรวจสอบ |
การสังเกตการณ์ |
|
คืออะไร |
การวัดและการรายงานเมตริกเฉพาะภายในระบบ เพื่อให้มั่นใจถึงความสมบูรณ์ของระบบ |
การรวบรวมเมตริก เหตุการณ์ ข้อมูลบันทึก และการติดตามเพื่อให้สามารถตรวจสอบข้อกังวลด้านประสิทธิภาพในเชิงลึกในระบบแบบกระจายด้วยสถาปัตยกรรมไมโครเซอร์วิส |
หลักสำคัญ |
รวบรวมข้อมูลเพื่อระบุผลกระทบของระบบที่ผิดปกติ |
ตรวจสอบสาเหตุที่แท้จริงของผลกระทบของระบบที่ผิดปกติ |
ระบบที่เกี่ยวข้อง |
โดยทั่วไปจะเกี่ยวข้องกับระบบสแตนด์อโลน |
โดยทั่วไปจะเกี่ยวข้องกับระบบที่แตกต่างกันหลายระบบ |
การตรวจสอบแบบย้อนกลับ |
จำกัดอยู่ที่ Edge (ขอบ) ของระบบ |
ใช้งานได้เมื่อมีการส่งสัญญาณผ่านสถาปัตยกรรมระบบที่แตกต่างกัน |
การค้นพบข้อผิดพลาดของระบบ |
เวลาและลักษณะ |
สาเหตุและวิธีการ |
AWS จะช่วยในด้านข้อมูลการสังเกตและการตรวจสอบของคุณได้อย่างไร
ระบบปฏิบัติการ AWS Cloud มีโมเดลและเครื่องมือสำหรับวิธีที่ปลอดภัยและมีประสิทธิภาพในการทำงานในคลาวด์ คุณสามารถปฏิรูปองค์กรของคุณ ปรับปรุงและย้ายแอปพลิเคชันของคุณให้ทันสมัย และเร่งสร้างนวัตกรรมด้วย Amazon Web Services (AWS)
ด้วยการตรวจสอบและข้อมูลการสังเกตในการดำเนินงานบนคลาวด์ คุณสามารถรวบรวม เชื่อมต่อ และวิเคราะห์การวัดและส่งข้อมูลทางไกลได้ สิ่งนี้ใช้ได้กับเครือข่าย โครงสร้างพื้นฐาน และแอปพลิเคชันของคุณในระบบคลาวด์ ไฮบริด หรือในองค์กร คุณสามารถรับข้อมูลเชิงลึกเกี่ยวกับพฤติกรรม ประสิทธิภาพ และสุขภาพของระบบของคุณ ด้วยข้อมูลเชิงลึกเหล่านี้ คุณสามารถตรวจจับ ตรวจสอบ และแก้ไขปัญหาได้รวดเร็วยิ่งขึ้น เมื่อใช้ร่วมกับปัญญาประดิษฐ์ (AI) และแมชชีนเลิร์นนิง (ML) คุณสามารถใช้ข้อมูลเชิงลึกเหล่านี้เพื่อตอบสนองเชิงรุก คาดการณ์ และป้องกันปัญหาได้
ตัวอย่างเช่น คุณสามารถใช้:
- AWS X-Ray เพื่อวิเคราะห์และแก้ไขข้อบกพร่องในการผลิตและแอปพลิเคชันแบบกระจาย ติดตามคำขอของผู้ใช้ ระบุปัญหาคอขวด และติดตามตรวจสอบประสิทธิภาพ
- Amazon CloudWatch เพื่อเข้าถึงและวิเคราะห์ข้อมูลทรัพยากรและแอปพลิเคชันและเอาต์พุตภายนอก โดยใช้เครื่องมือแสดงภาพที่มีประสิทธิภาพบน AWS On-Premise และในคลาวด์อื่น ๆ
- Amazon Managed Grafana เพื่อจัดการ Grafana (เครื่องมือตรวจสอบยอดนิยม) อย่างเต็มที่สำหรับการสืบค้น แสดงภาพ และแจ้งเตือนเกี่ยวกับเมตริก ข้อมูลบันทึก และการติดตามข้อมูลการดำเนินงาน
- Amazon Managed Service สำหรับ Prometheus เพื่อจัดการ Prometheus อย่างประสิทธิภาพ เครื่องมือตรวจสอบคอนเทนเนอร์สำหรับการบำรุงรักษาและสืบค้นเมตริกอนุกรมเวลาจากคลัสเตอร์คอนเทนเนอร์ Kubernetes ที่จัดการด้วยตนเองของคุณ
เริ่มต้นการติดตามตรวจสอบและข้อมูลการสังเกตใน AWS โดยสร้างบัญชีวันนี้