คำถามที่พบบ่อยเกี่ยวกับ Amazon Redshift

ข้อมูลทั่วไป

ลูกค้าหลายหมื่นรายใช้ Amazon Redshift ทุกวันเพื่อเรียกใช้การวิเคราะห์ SQL ในระบบคลาวด์ในการประมวลผลข้อมูลระดับเอกซะไบต์เพื่อให้ได้ข้อมูลเชิงลึกทางธุรกิจ ไม่ว่าข้อมูลที่มีปริมาณมากขึ้นเรื่อยๆ ของคุณจะถูกจัดเก็บไว้ในที่เก็บข้อมูลการดำเนินงาน, Data Lake, บริการข้อมูลสตรีม หรือชุดข้อมูลของบริษัทอื่น Amazon Redshift ก็สามารถช่วยคุณเข้าถึง ผสานรวม และแชร์ข้อมูลอย่างปลอดภัยโดยมีการโอนย้ายหรือคัดลอกน้อยที่สุด Amazon Redshift จะผสานการทำงานกับฐานข้อมูล AWS, การวิเคราะห์ และบริการแมชชีนเลิร์นนิงอย่างล้ำลึกเพื่อนำวิธีการ Zero-ETL มาใช้ หรือช่วยคุณเข้าถึงข้อมูลที่มีอยู่เพื่อใช้ในการวิเคราะห์ในแบบเกือบเรียลไทม์ สร้างโมเดลแมชชีนเลิร์นนิงใน SQL และเปิดใช้การวิเคราะห์ของ Apache Spark โดยใช้ข้อมูลใน Redshift Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้วิศวกร นักพัฒนา นักวิทยาศาสตร์ข้อมูล และนักวิเคราะห์สามารถเริ่มต้นทำงานได้ง่ายๆ และปรับขนาดการวิเคราะห์ได้อย่างรวดเร็วในสภาพแวดล้อมที่ไม่ต้องมีการบริหารจัดการ ด้วยกลไก Massively Parallel Processing (MPP) และสถาปัตยกรรมที่แยกการประมวลผลและการจัดเก็บข้อมูลออกจากกันเพื่อให้ได้นวัตกรรมการทำงานที่มีประสิทธิภาพ ปรับขนาดได้ และขับเคลื่อนด้วยแมชชีนเลิร์นนิง (ตัวอย่างเช่น AutoMaterialized Views) Amazon Redshift สร้างขึ้นมาเพื่อการปรับขนาดและมอบประสิทธิภาพการทำงานในราคาคุ้มค่ากว่าถึง 5 เท่าเมื่อเทียบกับคลังข้อมูลบนระบบคลาวด์อื่นๆ

ลูกค้าหลายพันรายเลือกใช้ Amazon Redshift เพื่อเร่งเวลารับข้อมูลเชิงลึก เนื่องจากเป็นระบบการวิเคราะห์ที่มีประสิทธิภาพที่ผสานการทำงานได้ดีกับฐานข้อมูลและบริการแมชชีนเลิร์นนิง จึงทำให้การใช้งานดียิ่งขึ้น และสามารถใช้เป็นบริการศูนย์กลางในการส่งมอบผลลัพธ์ตามความต้องการด้านการวิเคราะห์ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติเพื่อมอบประสิทธิภาพระดับสูงสำหรับเวิร์กโหลดที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ Amazon Redshift มอบประสิทธิภาพชั้นนำที่คุ้มกับราคาสำหรับเวิร์กโหลดการวิเคราะห์ที่หลากหลาย ไม่ว่าจะเป็นการทำแดชบอร์ด การพัฒนาแอปพลิเคชัน การแชร์ข้อมูล งาน ETL (Extract, Transform, Load) และอื่นๆ อีกมากมาย เนื่องจากมีลูกค้าหลายหมื่นรายที่เรียกใช้การวิเคราะห์ข้อมูลในระดับเทระไบต์ไปจนถึงเพตะไบต์ Amazon Redshift จึงช่วยเพิ่มประสิทธิภาพเวิร์กโหลดให้กับลูกค้าในสภาพแวดล้อมจริงโดยอิงจากการตรวจวัดประสิทธิภาพระยะไกลของกลุ่มอินสแตนซ์ และส่งมอบการทำงานที่ปรับขนาดเวิร์กโหลดได้ในเชิงเส้นในขณะควบคุมต้นทุนให้ต่ำอยู่เสมอ นวัตกรรมการทำงานที่ทันสมัยนี้มีให้บริการลูกค้าโดยไม่มีค่าใช้จ่ายเพิ่มเติม Amazon Redshift ช่วยให้คุณได้รับข้อมูลเชิงลึกจากการเรียกใช้การวิเคราะห์เชิงคาดการณ์แบบเรียลไทม์ในส่วนข้อมูลทั้งหมดทั่วทั้งฐานข้อมูลเชิงปฏิบัติการ, Data Lake, คลังข้อมูล, ข้อมูลการสตรีม และชุดข้อมูลของบุคคลภายนอก Amazon Redshift ยังรองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท, Amazon Virtual Private Cloud (Amazon VPC) และการปรับขนาดคลัสเตอร์ที่เร็วขึ้น

Amazon Redshift ได้รับการจัดการอย่างเต็มรูปแบบโดย AWS ดังนั้นคุณจึงไม่ต้องกังวลไปกับงานการจัดการคลังข้อมูลอีกต่อไป เช่น การจัดเตรียมฮาร์ดแวร์ การแพตช์ซอฟต์แวร์ การตั้งค่า การกำหนดค่า การตรวจสอบโหนดและไดรฟ์เพื่อกู้คืนจากความล้มเหลว หรือการสำรองข้อมูล AWS จะคอยจัดการงานที่จำเป็นในการตั้งค่า ดำเนินการ และปรับขนาดคลังข้อมูลในนามของคุณ ช่วยให้คุณให้ความสำคัญกับการสร้างแอปพลิเคชันของคุณได้เต็มที่ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยจัดเตรียมและปรับขนาดความจุคลังข้อมูลโดยอัตโนมัติ เพื่อมอบประสิทธิภาพระดับสูงสำหรับปริมาณงานที่ใช้ทรัพยากรมากและคาดเดาไม่ได้ และคุณจ่ายเฉพาะทรัพยากรที่คุณใช้เท่านั้น Amazon Redshift ยังมีความสามารถในการปรับค่าอัตโนมัติและแสดงคำแนะนำสำหรับการจัดการคลังเก็บข้อมูลของคุณใน Redshift Advisor อีกด้วย สำหรับ Redshift Spectrum นั้น Amazon Redshift ช่วยจัดการโครงสร้างพื้นฐานของการประมวลผลทั้งหมด การปรับสมดุลโหลด การวางแผน การกำหนดเวลา และการดำเนินการสืบค้นข้อมูลที่จัดเก็บไว้ใน Amazon S3 Amazon Redshift ช่วยให้คุณสามารถวิเคราะห์ข้อมูลทั้งหมดได้ด้วยการผสานการทำงานอย่างราบรื่นในบริการฐานข้อมูล พร้อมมีคุณสมบัติต่างๆ เช่น Amazon Aurora Zero-ETL ไปจนถึง Amazon Redshift และการสืบค้นแบบรวมไปจนถึงการเข้าถึงข้อมูลที่มีอยู่จากฐานข้อมูลเชิงปฏิบัติการอย่าง Amazon RDS และ Data Lake ของ Amazon S3 Redshift ช่วยให้สามารถนำข้อมูลเข้าอย่างมีประสิทธิภาพโดยไม่ต้องใช้โค้ด เป็นไปป์ไลน์ข้อมูลแบบอัตโนมัติที่นำเข้าข้อมูลการสตรีมหรือไฟล์จาก Amazon S3 โดยอัตโนมัติ Redshift ยังผสานการทำงานกับ AWS Data Exchange ช่วยให้ผู้ใช้สามารถค้นหา สมัครรับข้อมูล และสืบค้นชุดข้อมูลของบุคคลภายนอก และผสานรวมเข้ากับข้อมูลของตนเพื่อให้ได้ข้อมูลเชิงลึกที่ครบถ้วนครอบคลุม การผสานรวมการทำงานในตัวลงใน Amazon SageMaker ช่วยให้ลูกค้าสามารถดำเนินการได้จากคลังข้อมูลของตน และสร้าง ฝึกฝน และออกแบบโมเดลแมชชีนเลิร์นนิงใน SQL Amazon Redshift ตอบสนองความต้องการด้านการวิเคราะห์ SQL ทั้งหมดซึ่งมีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า

Amazon Redshift เป็นบริการที่มีการจัดการเต็มรูปแบบและมีตัวเลือกทั้งแบบเตรียมใช้งานและแบบไม่ต้องใช้เซิร์ฟเวอร์ ซึ่งช่วยให้การเรียกใช้และการปรับขนาดการวิเคราะห์มีประสิทธิภาพยิ่งขึ้นโดยไม่ต้องจัดการคลังข้อมูลของคุณ คุณสามารถเรียกใช้งานตำแหน่งข้อมูล Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์โฉมใหม่เพื่อเตรียมใช้งานคลังข้อมูลโดยอัตโนมัติในไม่กี่วินาที หรือคุณสามารถเลือกตัวเลือกที่มีการเตรียมใช้งานสำหรับเวิร์กโหลดที่คาดเดาได้ก็ได้

คุณสามารถเริ่มสืบค้นข้อมูลได้เพียงไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า ซึ่งรวมถึงชุดข้อมูลวัดประสิทธิภาพ TPC-H, TPC-DS และตัวอย่างการสืบค้นอื่นๆ เพื่อเริ่มการวิเคราะห์ได้ทันที หากต้องการเริ่มต้นใช้งาน Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ให้เลือก “ลองใช้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์” และเริ่มสืบค้นข้อมูล เริ่มต้นที่นี่

ผลการวัดประสิทธิภาพ TPC-DS แสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่าที่สุดตั้งแต่แรกเริ่ม แม้จะใช้ชุดข้อมูลขนาด 3 TB ที่ค่อนข้างเล็กก็ตาม Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 5 เท่า ซึ่งหมายความว่าคุณจะได้รับประโยชน์จากความคุ้มค่าระดับชั้นนำของ Amazon Redshift นี้ตั้งแต่แรกเริ่มโดยไม่ต้องปรับแต่งอะไรเองเลย จากประสิทธิภาพการตรวจวัดระยะไกลในกลุ่มอินสแตนซ์ของเรา เรายังทราบอีกว่าเวิร์กโหลดส่วนใหญ่นั้นเป็นเวิร์กโหลดการสืบค้นระยะสั้น (เวิร์กโหลดที่ทำงานน้อยกว่า 1 วินาที) สำหรับเวิร์กโหลดเหล่านี้ เกณฑ์มาตรฐานล่าสุดแสดงให้เห็นว่า Amazon Redshift มีความคุ้มค่ากว่าคลังข้อมูลบนระบบคลาวด์อื่นๆ ถึง 7 เท่า ทั้งด้านการทำงานพร้อมกันในระดับสูงและเวิร์กโหลดที่มีเวลาแฝงต่ำ เรียนรู้เพิ่มเติมที่นี่

ได้ ผู้เชี่ยวชาญของ Amazon Redshift พร้อมตอบคำถามต่างๆ และให้การสนับสนุน โปรดติดต่อเรา แล้วคุณจะได้รับการติดต่อกลับจากเราภายในหนึ่งวันทำการเพื่อพูดคุยว่า AWS สามารถช่วยเหลือองค์กรของคุณอย่างไรได้บ้าง

Amazon Redshift Managed Storage มีให้เลือกใช้แบบไร้เซิร์ฟเวอร์และมาพร้อมกับประเภทโหนด RA3 ช่วยให้คุณสามารถปรับขนาดและจ่ายค่าบริการสำหรับการประมวลผลและพื้นที่จัดเก็บแยกกันได้ ซึ่งทำให้คุณสามารถกำหนดขนาดของคลัสเตอร์ตามความต้องการในการประมวลผลของคุณเพียงอย่างเดียว โดยจะใช้พื้นที่จัดเก็บเฉพาะที่ SSD ประสิทธิภาพสูงเป็นแคชชั้นที่ 1 โดยอัตโนมัติ และใช้ประโยชน์ของการปรับประสิทธิภาพให้เหมาะสม เช่น อุณหภูมิของบล็อกข้อมูล อายุของบล็อกข้อมูล และรูปแบบของปริมาณงานเพื่อการทำงานมีประสิทธิภาพสูงในขณะที่ปรับขนาดพื้นที่จัดเก็บไปยัง Amazon S3 โดยอัตโนมัติเมื่อจำเป็นโดยไม่ต้องดำเนินการใดๆ

หากคุณใช้โหนด Amazon Redshift Dense Storage หรือ Dense Compute อยู่แล้ว คุณสามารถใช้ Elastic Resize เพื่ออัปเกรดคลัสเตอร์ที่มีอยู่เดิมให้เป็นอินสแตนซ์การประมวล RA3 แบบใหม่ได้ Amazon Redshift Serverless และคลัสเตอร์ที่ใช้อินสแตนซ์ RA3 จะใช้พื้นที่จัดเก็บที่มีการจัดการโดย Redshift โดยอัตโนมัติเพื่อจัดเก็บข้อมูล โดยไม่จำเป็นต้องดำเนินการอื่นใดนอกเหนือจากการใช้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ หรืออินสแตนซ์ RA3 เพื่อใช้คุณสมบัตินี้

Amazon Redshift Spectrum เป็นคุณสมบัติหนึ่งของ Amazon Redshift ที่ให้คุณสามารถเรียกใช้การสืบค้นกับ Data Lake ใน Amazon S3 ได้โดยไม่ต้องมีการโหลดข้อมูลหรือ ETL เมื่อสร้างการสืบค้น SQL ระบบจะส่งการสืบค้นนั้นไปยังตำแหน่งข้อมูลของ Amazon Redshift ซึ่งจะสร้างและปรับแผนการสืบค้นให้ดีขึ้น Amazon Redshift จะระบุว่าข้อมูลใดอยู่ในเครื่องและข้อมูลใดอยู่ใน Amazon S3 แล้วสร้างแผนในการลดจำนวนข้อมูล S3 ที่ต้องอ่านให้น้อยที่สุด จากนั้นส่งคำขอโปรแกรมทำงานของ Amazon Redshift Spectrum จากแหล่งทรัพยากรร่วมเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3

พิจารณาเลือกใช้โหนด RA3 ในกรณีต่อไปนี้

  • คุณต้องการความยืดหยุ่นในการปรับขนาดและจ่ายค่าบริการประมวลผลแยกกับพื้นที่จัดเก็บ
  • คุณสืบค้นข้อมูลเพียงส่วนหนึ่งของข้อมูลทั้งหมด
  • ปริมาณข้อมูลของคุณเพิ่มขึ้นอย่างรวดเร็วหรือคาดว่าจะเพิ่มขึ้นอย่างรวดเร็ว
  • คุณต้องการความยืดหยุ่นในการปรับขนาดคลัสเตอร์ตามความต้องการด้านประสิทธิภาพของคุณเท่านั้น

เมื่อข้อมูลเพิ่มขึ้นเรื่อยๆ ไปจนถึงระดับเพตะไบต์ ปริมาณข้อมูลที่คุณนำเข้าไปยังคลังข้อมูล Amazon Redshift ของคุณก็จะเพิ่มขึ้นด้วยเช่นกัน คุณอาจกำลังมองหาวิธีที่จะวิเคราะห์ข้อมูลทั้งหมดของคุณอย่างคุ้มค่า

อินสแตนซ์ RA3 ของ Amazon Redshift โฉมใหม่พร้อมพื้นที่จัดเก็บที่มีการจัดการ ช่วยให้คุณสามารถเลือกจำนวนโหนดโดยขึ้นอยู่กับข้อกำหนดด้านประสิทธิภาพการทำงาน และจ่ายค่าบริการเฉพาะพื้นที่จัดเก็บข้อมูลที่มีการจัดการซึ่งคุณใช้งานเท่านั้น ซึ่งช่วยให้คุณมีความยืดหยุ่นในการกำหนดขนาดคลัสเตอร์ RA3 ของคุณตามปริมาณข้อมูลที่คุณประมวลผลในแต่ละวันโดยไม่เพิ่มค่าใช้จ่ายด้านพื้นที่จัดเก็บข้อมูลแต่อย่างใด อินสแตนซ์ RA3 ที่สร้างขึ้นบน AWS Nitro System พร้อมพื้นที่จัดเก็บที่มีการจัดการจะใช้ SSD ประสิทธิภาพสูงสำหรับข้อมูล Hot (ข้อมูลที่เข้าถึงบ่อย) และใช้ Amazon S3 สำหรับข้อมูล Cold (ข้อมูลที่เข้าถึงไม่บ่อย) ซึ่งใช้งานได้ง่าย จัดเก็บข้อมูลได้คุ้มค่า และสืบค้นได้รวดเร็ว

Amazon Redshift Spatial มีการวิเคราะห์ข้อมูลเชิงลึกจำนวนมากตามตำแหน่งกับข้อมูลของคุณ ซึ่งรวมข้อมูลเชิงพื้นที่และข้อมูลธุรกิจได้อย่างราบรื่นในการวิเคราะห์เพื่อการตัดสินใจ Amazon Redshift เปิดตัวการสนับสนุนการประมวลผลข้อมูลเชิงพื้นที่แบบเนทีฟในเดือนพฤศจิกายน 2019 โดยมีประเภทข้อมูลพหุสันฐาน GEOMETRY และฟังก์ชันเชิงพื้นที่ SQL ที่สำคัญหลายรายการ ขณะนี้เรารองรับประเภทข้อมูล GEOGRAPHY และไลบรารีฟังก์ชันเชิงพื้นที่ SQL ของเราได้เติบโตขึ้นเป็น 80 เรารองรับประเภทข้อมูลและมาตรฐานเชิงพื้นที่ทั่วไปทั้งหมด รวมถึง Shapefiles, GeoJSON, WKT, WKB, eWKT และ eWKB หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่หน้า เอกสารประกอบ หรือหน้า บทแนะนำสอนการใช้งาน Amazon Redshift Spatial

Amazon Athena และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ ตอบสนองความต้องการและกรณีการใช้งานที่แตกต่างกันแม้ว่าทั้งสองบริการจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์และให้บริการแก่ผู้ใช้ SQL ก็ตาม

ด้วยสถาปัตยกรรม Massively Parallel Processing (MPP) ที่แยกที่จัดเก็บและการประมวลผลออกจากกัน รวมถึงความสามารถในการปรับประสิทธิภาพอัตโนมัติที่สนับสนุนโดยแมชชีนเลิร์นนิง คลังข้อมูลอย่าง Amazon Redshift ไม่ว่าจะเป็นแบบไม่ต้องใช้เซิร์ฟเวอร์หรือแบบเตรียมใช้งาน ก็ล้วนเป็นตัวเลือกที่ยอดเยี่ยมสำหรับลูกค้าที่ต้องการประสิทธิภาพการทำงานที่คุ้มราคาในทุกขนาดการใช้งานสำหรับเวิร์กโหลด BI และการวิเคราะห์ข้อมูลที่ซับซ้อน ลูกค้าสามารถใช้ Amazon Redshift เป็นองค์ประกอบศูนย์กลางของสถาปัตยกรรมข้อมูลที่มีการผสานการทำงานขั้นละเอียดพร้อมให้เข้าถึงข้อมูลที่มีอยู่ หรือนำเข้าหรือย้ายข้อมูลลงในคลังข้อมูลได้ง่ายๆ เพื่อการวิเคราะห์ข้อมูลที่มีประสิทธิภาพสูงผ่าน ZeroETL และไม่ต้องใช้โค้ด ลูกค้าสามารถเข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon S3, ฐานข้อมูลเชิงปฏิบัติการอย่าง Aurora และ Amazon RDS, คลังข้อมูลของบุคคลภายนอกผ่านการผสานการทำงานกับ AWS Data Exchange และผสานรวมกับข้อมูลที่จัดเก็บไว้ในคลังข้อมูล Amazon Redshift เพื่อการวิเคราะห์ข้อมูล ผู้ใช้สามารถเริ่มต้นการจัดทำคลังข้อมูลได้ง่ายๆ และดำเนินการแมชชีนเลิร์นนิงเพิ่มเติมจากข้อมูลทั้งหมดนี้ด้วย

Amazon Athena เหมาะสำหรับใช้ในการวิเคราะห์เชิงโต้ตอบและการสำรวจข้อมูลที่อยู่ใน Data Lake หรือแหล่งที่มาของข้อมูลใดๆ ผ่านเฟรมเวิร์กส่วนเชื่อมต่อแบบขยายได้ (รวมถึงตัวเชื่อมต่อที่ใช้งานได้ฟรีทันทีกว่า 30 รายการสำหรับแอปพลิเคชันและระบบการวิเคราะห์ข้อมูลในสถานที่หรือบนระบบคลาวด์อื่นๆ) โดยไม่ต้องกังวลถึงการนำเข้าหรือประมวลผลข้อมูล Amazon Athena สร้างขึ้นบนเครื่องมือและเฟรมเวิร์กแบบโอเพนซอร์ส เช่น Spark, Presto และ Apache Iceberg ลูกค้าจึงมีความยืดหยุ่นในการใช้ Python หรือ SQL หรือทำงานกับข้อมูลรูปแบบเปิด หากลูกค้าต้องการวิเคราะห์ข้อมูลเชิงโต้ตอบโดยใช้เฟรมเวิร์กและข้อมูลรูปแบบโอเพนซอร์ส Amazon Athena ถือเป็นการเริ่มต้นที่ยอดเยี่ยม

ไม่ อินสแตนซ์ Redshift Reserved นั้นไม่มีความยืดหยุ่น และมีผลกับประเภทโหนดที่แน่นอนที่คุณสำรองไว้เท่านั้น

ไม่ต้องใช้เซิร์ฟเวอร์

Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ คือตัวเลือกแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Amazon Redshift ที่ช่วยให้เรียกใช้และปรับขนาดการวิเคราะห์ได้อย่างมีประสิทธิภาพยิ่งขึ้นภายในเวลาไม่กี่วินาทีโดยไม่จำเป็นต้องตั้งค่าและจัดการโครงสร้างพื้นฐานคลังข้อมูล Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ช่วยให้ผู้ใช้ทุกคน รวมถึงนักวิเคราะห์ข้อมูล นักพัฒนา นักธุรกิจ และนักวิทยาศาสตร์ข้อมูล ได้รับข้อมูลเชิงลึกจากข้อมูลเพียงแค่โหลดและสืบค้นข้อมูลในคลังข้อมูล

คุณสามารถเลือก "กำหนดค่า Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์" และเริ่มสืบค้นข้อมูลได้เพียงทำไม่กี่ขั้นตอนในคอนโซลการจัดการของ AWS คุณสามารถใช้ประโยชน์จากชุดข้อมูลตัวอย่างที่โหลดไว้ล่วงหน้า เช่น ข้อมูลสภาพอากาศ ข้อมูลสำมะโน และชุดข้อมูลวัดประสิทธิภาพ พร้อมกับการสืบค้นตัวอย่างเพื่อเริ่มการวิเคราะห์ทันที คุณสามารถสร้างฐานข้อมูล สคีมา ตาราง และโหลดข้อมูลจาก Amazon S3, แชร์ข้อมูลของ Amazon Redshift หรือกู้คืนจากสแนปช็อตคลัสเตอร์ที่มีการเตรียมใช้งานของ Redshift ที่มีอยู่ และคุณยังสามารถสืบค้นข้อมูลโดยตรงในรูปแบบเปิด (เช่น Parquet หรือ ORC) ใน Data Lake ของ Amazon S3 หรือสืบค้นข้อมูลในฐานข้อมูลปฏิบัติการ เช่น Amazon Aurora และ Amazon RDS PostgreSQL และ MySQL ดูคู่มือเริ่มต้นใช้งาน

หากคุณไม่มีประสบการณ์ในการจัดการคลังข้อมูล คุณก็ไม่ต้องกังวลกับการตั้งค่า การกำหนดค่า การจัดการคลัสเตอร์ หรือการปรับแต่งคลังข้อมูล คุณสามารถให้ความสำคัญกับการรับข้อมูลเชิงลึกที่สำคัญจากข้อมูลของคุณ หรือการนำเสนอผลลัพธ์ทางธุรกิจหลักของคุณผ่านข้อมูล และจ่ายค่าบริการเฉพาะส่วนที่คุณใช้เท่านั้น ช่วยให้ดูแลจัดการต้นทุนได้ตลอด โดยคุณยังคงได้รับประโยชน์จากประสิทธิภาพชั้นยอดทั้งหมดของ Amazon Redshift, คุณสมบัติ SQL ที่หลากหลาย, การผสานรวมกับที่เก็บข้อมูลดิบและคลังข้อมูลปฏิบัติการอย่างราบรื่น และคุณสมบัติวิเคราะห์เชิงคาดการณ์ในตัวและการแชร์ข้อมูล หากคุณต้องการควบคุมคลังข้อมูลอย่างละเอียด คุณสามารถจัดเตรียมคลัสเตอร์ Redshift ได้

คุณสามารถใช้ฟังก์ชันการวิเคราะห์ที่หลากหลายทั้งหมดของ Amazon Redshift ได้ต่อไป เช่น การรวบรวมที่ซับซ้อน การสืบค้นโดยตรงไปยังข้อมูลใน Data Lake ของ Amazon S3 และฐานข้อมูลเชิงปฏิบัติการ, มุมมองผลการสืบค้น, ขั้นตอนกระบวนการที่จัดเก็บไว้, การสนับสนุนข้อมูลกึ่งมีโครงสร้าง และ ML อีกทั้งยังมีประสิทธิภาพสูงในทุกระดับขนาดอีกด้วย บริการที่เกี่ยวข้องทั้งหมดที่ Amazon Redshift ใช้งานร่วมกันได้ (เช่น Amazon Kinesis, AWS Lambda, Amazon QuickSight, Amazon SageMaker, Amazon EMR, AWS Lake Formation และ AWS Glue) ยังคงใช้งานกับ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ต่อไปได้

คุณสามารถเรียกใช้กรณีการใช้งานการวิเคราะห์ทั้งหมดต่อไปได้ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ พร้อมเวิร์กโฟลว์การเริ่มต้นใช้งานที่เรียบง่าย การปรับขนาดอัตโนมัติ และการจ่ายค่าบริการตามที่ใช้งานช่วยให้การเรียกใช้การพัฒนาและการทดสอบสภาพแวดล้อมที่ต้องเริ่มต้นอย่างรวดเร็ว การวิเคราะห์ธุรกิจเฉพาะทาง เวิร์กโหลดที่มีความต้องการด้านการประมวลผลที่แตกต่างกันและคาดเดาไม่ได้ และเวิร์กโหลดที่ไม่ต่อเนื่องหรือไม่สม่ำเสมอมีประสิทธิภาพและคุ้มค่ายิ่งขึ้น

การนำข้อมูลเข้าและการโหลดข้อมูล

คุณสามารถโหลดข้อมูลเข้าไปยัง Amazon Redshift ได้จากแหล่งที่มาของข้อมูลต่าง ๆ มากมาย ได้แก่ Amazon S3, Amazon RDS, Amazon DynamoDB, Amazon EMR, AWS Glue, AWS Data Pipeline และ/หรือโฮสต์ที่เปิดใช้ SSH บน Amazon EC2 หรือในองค์กร Amazon Redshift จะพยายามโหลดข้อมูลของคุณโดยพร้อมกันเข้าไปยังโหนดประมวลผลแต่ละโหนด เพื่อเพิ่มอัตราที่คุณสามารถนำข้อมูลเข้าไปยังคลัสเตอร์คลังข้อมูลของคุณได้ ไคลเอ็นต์สามารถเชื่อมต่อเข้ากับ Amazon Redshift โดยใช้ ODBC หรือ JDBC และออกคำสั่ง SQL 'insert' เพื่อแทรกข้อมูลได้ โปรดทราบว่า วิธีนี้จะช้ากว่าการใช้ S3 หรือ DynamoDB เนื่องจากวิธีการดังกล่าวจะโหลดข้อมูลโดยพร้อมกันไปยังโหนดประมวลผลแต่ละโหนด ขณะที่คำสั่ง ‘insert’ ของ SQL จะโหลดผ่านโหนดนำตัวเดียว สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับการโหลดข้อมูลเข้าไปยัง Amazon Redshift โปรดดูที่ คู่มือการเริ่มใช้งานของเรา

การคัดลอกอัตโนมัติของ Redshift ช่วยให้สามารถใช้คำสั่งคัดลอกอัตโนมัติโดยการติดตามโฟลเดอร์ใน Amazon S3 และนำเข้าไฟล์ใหม่ๆ โดยที่ลูกค้าไม่ต้องดำเนินการเอง หากไม่ใช้ฟังก์ชันการคัดลอกอัตโนมัติ คำสั่งคัดลอกจะเริ่มต้นขั้นตอนการนำเข้าไฟล์สำหรับไฟล์ที่มีอยู่ทันที การคัดลอกอัตโนมัติจะส่งคำสั่งคัดลอกที่มีอยู่และสามารถ 1/ ทำให้ขั้นตอนการนำเข้าไฟล์เป็นแบบอัตโนมัติ โดยตรวจติดตามเส้นทางต่างๆ ใน Amazon S3 ที่ระบุสำหรับไฟล์ใหม่ๆ 2/ ใช้การกำหนดค่าการคัดลอกซ้ำ ลดความต้องการในการสร้างและเรียกใช้คำสั่งคัดลอกใหม่ๆ สำหรับงานการนำเข้าซ้ำๆ และ 3/ ติดตามไฟล์ที่โหลดมาเพื่อหลีกเลี่ยงการคัดลอกข้อมูลซ้ำ

ในการเริ่มต้น ลูกค้าควรมีโฟลเดอร์ใน Amazon S3 ซึ่งสามารถเข้าถึงได้โดยคลัสเตอร์/ตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ของ Redshift โดยใช้บทบาทใน IAM ที่เกี่ยวข้อง และสร้างตาราง Redshift ที่จะใช้เป็นเป้าหมาย หลังจากที่เส้นทาง Amazon S3 และตาราง Redshift พร้อมแล้ว ลูกค้าสามารถสร้างงานคัดลอกโดยใช้คำสั่งคัดลอกได้ หลังจากสร้างงานคัดลอกแล้ว Redshift จะเริ่มติดตามเส้นทาง Amazon S3 ที่ระบุในการทำงานเบื้องหลัง และเริ่มคำสั่งคัดลอกที่ผู้ใช้กำหนดเพื่อคัดลอกไฟล์ใหม่ๆ ลงในตารางเป้าหมายโดยอัตโนมัติ

กรณีการใช้งานที่สำคัญมีดังนี้: 1/ ลูกค้าที่ใช้ Amazon EMR และ AWS Glue เพื่อเรียกใช้งาน Apache Spark ที่จะเข้าถึงและโหลดข้อมูลลงใน Amazon Redshift อันเป็นส่วนหนึ่งของไปป์ไลน์การนำข้อมูลเข้าและการแปลงข้อมูล (แบตช์และการสตรีม) 2/ ลูกค้าที่ใช้ Amazon SageMaker ในการดำเนินงานแมชชีนเลิร์นนิงโดยใช้ Apache Spark และจะต้องเข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon Redshift สำหรับกระบวนการสร้างฟีเจอร์ใหม่และการแปลงข้อมูล 3/ ลูกค้า Amazon Athena ที่ใช้ Apache Spark ในการวิเคราะห์เชิงโต้ตอบกับข้อมูลที่อยู่ใน Amazon Redshift

Baikal มีประโยชน์ดังต่อไปนี้:

  • ใช้งานง่ายในการเริ่มต้นและเรียกใช้แอปพลิเคชัน Apache Spark บนข้อมูลใน Amazon Redshift โดยไม่ต้องกังวลกับขั้นตอนที่ต้องดำเนินการด้วยตนเองซึ่งเกี่ยวข้องกับการตั้งค่าและการบำรุงรักษา Spark สำหรับเวอร์ชันที่ไม่ผ่านการรับรอง
  • ความสะดวกในการใช้ Apache Spark จากบริการต่าง ๆ ของ AWS เช่น Amazon EMR, AWS Glue, Amazon Athena และ Amazon SageMaker พร้อม Amazon Redshift ด้วยการกำหนดค่าที่น้อยที่สุด
  • ปรับปรุงประสิทธิภาพขณะเรียกใช้แอปพลิเคชัน Apache Spark บน Amazon Redshift

การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าของ Amazon Aurora และ Amazon Redshift สามารถเรียกใช้การวิเคราะห์ในแบบเกือบเรียลไทม์และแมชชีนเลิร์นนิงสำหรับข้อมูลการดำเนินการในระดับเพตะไบต์ได้ โดยเสนอโซลูชันที่มีการจัดการเต็มรูปแบบเพื่อจัดทำข้อมูลการดำเนินการจาก Amazon Aurora ที่มีอยู่ใน Amazon Redshift หลังจากเขียนออกมาได้ภายในไม่กี่วินาที ด้วยการเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ลูกค้าเพียงแค่ต้องเลือกตาราง Amazon Aurora ที่มีข้อมูลที่ตนต้องการเพื่อวิเคราะห์โดยใช้ Amazon Redshift และคุณสมบัตินี้จะทำซ้ำสคีมาและข้อมูลลงใน Amazon Redshift อย่างราบรื่น ซึ่งจะช่วยลดความจำเป็นที่ลูกค้าจะต้องสร้างและจัดการไปป์ไลน์ข้อมูลที่ซับซ้อน และมีเวลาให้ความสำคัญกับการพัฒนาแอปพลิเคชันของตนแทน การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าสามารถทำซ้ำข้อมูลจากคลัสเตอร์ฐานข้อมูล Amazon Aurora หลายแหล่งลงในอินสแตนซ์ Amazon Redshift เดียวกันเพื่อรับข้อมูลเชิงลึกที่ครบถ้วนทั่วแอปพลิเคชันต่างๆ ไปพร้อมกับรวบรวมสินทรัพย์การวิเคราะห์หลัก ประหยัดต้นทุนอย่างมาก และดำเนินงานได้อย่างมีประสิทธิภาพ การเชื่อมข้อมูลจาก Amazon Aurora Zero-ETL ไปยัง Amazon Redshift ช่วยให้ลูกค้าสามารถเข้าถึงการวิเคราะห์หลักและความสามารถด้านแมชชีนเลิร์นนิงของ Amazon Redshift ได้ด้วย เช่น มุมมองผลการสืบค้น การแชร์ข้อมูล และการเข้าถึงแหล่งเก็บข้อมูลและ Data Lake หลายแหล่งจากส่วนกลาง ซึ่งช่วยให้ลูกค้าสามารถรวมการวิเคราะห์หลักในแบบเกือบเรียลไทม์เพื่อรับข้อมูลเชิงลึกสุดรวดเร็วที่จะช่วยในการตัดสินใจทางธุรกิจอย่างมีข้อมูล นอกจากนี้ ลูกค้าจะใช้ Amazon Aurora สำหรับธุรกรรมและ Amazon Redshift สำหรับการวิเคราะห์ จึงไม่จำเป็นต้องใช้แหล่งข้อมูลการประมวลผลร่วมกัน ทำให้ได้โซลูชันที่มีประสิทธิภาพการทำงานและการดำเนินงานที่เสถียร

การบูรณาการ ETL แบบไร้รอยต่อของ Amazon Aurora กับ Amazon Redshift นำเสนอการผสานรวมที่ราบรื่นระหว่างบริการทั้งสองสำหรับการวิเคราะห์ธุรกรรม

ข้อมูลการสตรีมแตกต่างจากตารางฐานข้อมูลแบบเดิมตรงที่เมื่อคุณสืบค้นการสตรีม คุณกำลังได้รับวิวัฒนาการความสัมพันธ์ที่แปรเปลี่ยนตามเวลา ในขณะที่ตารางจะบันทึกสแนปช็อต ณ จุดเวลาใดเวลาหนึ่งของความสัมพันธ์ที่แปรเปลี่ยนตามเวลานี้ ลูกค้าของ Amazon Redshift คุ้นเคยกับการทำงานกับตารางทั่วไปและดำเนินการประมวลผลขั้นปลาย (เช่น การแปลงข้อมูล) ของข้อมูลโดยใช้โมเดลแบตช์แบบเดิม เช่น “ELT” เรามอบวิธีการใช้มุมมองผลการสืบค้น (MV) ของ Redshift เพื่อให้ลูกค้าสามารถเห็นมุมมองผลการสืบค้น ณ จุดเวลาใดเวลาหนึ่งของการสตรีมได้ง่ายๆ ซึ่งรวมกันเป็นเวลาที่ใช้ในการสืบค้น และรวดเร็วพอที่จะรองรับเวิร์กโฟลว์ ELT

การแบ่งปันข้อมูล

กรณีการใช้งานที่สำคัญมีดังนี้

  • การแชร์ข้อมูลของคลัสเตอร์ ETL ส่วนกลางกับคลัสเตอร์ BI/การวิเคราะห์จำนวนมาก เพื่อแยกปริมาณงานในการอ่านและดูแลควบคุมเพิ่มเติม
  • ผู้ให้บริการข้อมูลแชร์ข้อมูลกับผู้บริโภคภายนอก
  • การแชร์ชุดข้อมูลทั่วไป เช่น ลูกค้า ผลิตภัณฑ์ในกลุ่มธุรกิจต่างๆ และการทำงานร่วมกันเพื่อการวิเคราะห์ในวงกว้างและวิทยาศาสตร์ข้อมูล
  • การกระจายศูนย์ข้อมูลเพื่อให้จัดการได้ง่ายขึ้น
  • การแชร์ข้อมูลระหว่างสภาพแวดล้อมการพัฒนา การทดสอบ และการผลิต
  • การเข้าถึงข้อมูล Redshift จากบริการวิเคราะห์อื่นๆ ของ AWS

การสืบค้นข้ามฐานข้อมูลทำให้คุณสามารถสืบค้นและรวมข้อมูลจากฐานข้อมูล Redshift ต่างๆ ที่คุณมีสิทธิ์เข้าถึงเข้าด้วยกันได้อย่างราบรื่น ไม่ว่าคุณกำลังเชื่อมต่อกับฐานข้อมูลใดอยู่ก็ตาม ซึ่งรวมถึงฐานข้อมูลที่อยู่ในคลัสเตอร์ และชุดข้อมูลสำหรับแชร์ที่มีให้จากคลัสเตอร์ระยะไกล การสืบค้นข้ามฐานข้อมูลช่วยให้คุณสามารถจัดระเบียบข้อมูลเป็นฐานข้อมูลที่แยกกันได้อย่างยืดหยุ่นเพื่อให้รองรับการกำหนดค่าแบบหลายผู้ใช้ได้

AWS Data Exchange ช่วยให้ลูกค้า AWS สามารถแลกเปลี่ยนและใช้ข้อมูลของบุคคลภายนอกใน AWS ได้อย่างปลอดภัยและมีประสิทธิภาพมากขึ้น นักวิเคราะห์ข้อมูล ผู้จัดการผลิตภัณฑ์ ผู้จัดการพอร์ตโฟลิโอ นักวิทยาศาสตร์ข้อมูล นักวิจัยเชิงปริมาณ ช่างเทคนิคด้านการทดลองทางคลินิก และนักพัฒนาในเกือบทุกอุตสาหกรรมต่างต้องการเข้าถึงข้อมูลจำนวนมากขึ้นเพื่อดำเนินการวิเคราะห์ ฝึกฝนโมเดล ML และตัดสินใจโดยใช้ข้อมูลเป็นหลัก แต่ไม่มีอะไรที่สามารถค้นหาข้อมูลจากผู้ให้บริการหลายรายได้ อีกทั้งผู้ให้บริการแต่ละรายยังส่งมอบข้อมูลแตกต่างกัน ทำให้ต้องเจอกับสื่อทางกายภาพ, ข้อมูล FTP และการเรียก API ตามความต้องการแบบต่างๆ มากมาย ในทางกลับกัน องค์กรจำนวนมากต้องการให้ข้อมูลของตนพร้อมสำหรับวัตถุประสงค์ด้านการวิจัยหรือการค้า แต่การสร้างและการดูแลการส่งข้อมูล การให้สิทธิ์ และเทคโนโลยีการเรียกเก็บเงินนั้นยากและมีต้นทุนสูง ซึ่งลดการให้ข้อมูลที่มีค่าให้ต่ำลงไปอีก

ความสามารถในการเพิ่มทรัพยากรและการทำงานพร้อมกัน

Amazon Redshift Serverless จะจัดเตรียมความจุของคลังข้อมูลโดยอัตโนมัติ และปรับทรัพยากรพื้นฐานอย่างชาญฉลาด Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์จะปรับความจุในไม่กี่วินาทีเพื่อมอบประสิทธิภาพที่สูงอย่างสม่ำเสมอ และลดความยุ่งยากในการปฏิบัติงานสำหรับเวิร์กโหลดที่มีความต้องการสูงและผันผวนมากที่สุด คุณสมบัติการปรับขนาดพร้อมกันเปิดโอกาสให้คุณสนับสนุนผู้ใช้และการสืบค้นพร้อมกันได้อย่างไม่จำกัดจำนวน โดยมีประสิทธิภาพการสืบค้นที่รวดเร็วสม่ำเสมอ เมื่อมีการเปิดใช้งานการปรับขนาดพร้อมกัน Amazon Redshift จะเพิ่มความจุคลัสเตอร์ให้โดยอัตโนมัติเมื่อประสบการณ์คลัสเตอร์ของคุณเพิ่มขึ้นในคิวการสืบค้น

สำหรับการเพิ่มทรัพยากรด้วยตนเอง หากคุณต้องการเพิ่มประสิทธิภาพในการสืบค้นและการตอบสนองต่อ CPU, หน่วยความจำ หรือการใช้งาน I/O เกินกำลัง คุณสามารถเพิ่มจำนวนโหนดภายในคลัสเตอร์คลังข้อมูลได้โดยใช้ Elastic Resize ผ่าน คอนโซลการจัดการของ AWS หรือ API ModifyCluster หากคุณปรับเปลี่ยนคลัสเตอร์คลังข้อมูล ระบบจะดำเนินการปรับเปลี่ยนตามที่คุณร้องขอโดยทันที ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Redshift สามารถใช้งานได้ฟรีผ่านคอนโซลการจัดการของ AWS หรือ API ของ Amazon CloudWatch นอกจากนี้ คุณยังสามารถเพิ่มตัวชี้วัดที่ผู้ใช้กำหนดผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้เช่นกัน

Amazon Redshift Spectrum ช่วยให้คุณสามารถเรียกใช้คลัสเตอร์ Redshift ได้หลายตัวซึ่งมีการเข้าถึงข้อมูลเดียวกันใน Amazon S3 คุณสามารถใช้คลัสเตอร์ที่ต่างกันสำหรับกรณีใช้งานที่ต่างกันได้ ตัวอย่างเช่น คุณสามารถใช้หนึ่งคลัสเตอร์สำหรับการรายงานมาตรฐานและอีกหนึ่งคลัสเตอร์สำหรับการสืบค้นข้อมูล ฝ่ายการตลาดของคุณสามารถใช้คลัสเตอร์ของตนเองที่แตกต่างจากฝ่ายปฏิบัติการได้ Redshift Spectrum จะกระจายการดำเนินการสืบค้นไปยังโปรแกรมทำงานของ Redshift Spectrum ทั้งหลายนอกเหนือจากแหล่งทรัพยากรที่ใช้ร่วมกันเพื่ออ่านและประมวลผลข้อมูลจาก Amazon S3 และดึงผลลัพธ์กลับไปยังคลัสเตอร์ Redshift เพื่อการประมวลผลใดๆ ที่เหลืออยู่

ขึ้นอยู่กับสถานการณ์ เมื่อคุณใช้คุณสมบัติการปรับขนาดพร้อมกัน คลัสเตอร์จะพร้อมให้ใช้งานเพื่ออ่านและเขียนอย่างเต็มที่ในระหว่างการปรับขนาดพร้อมกัน ด้วย Elastic Resize คลัสเตอร์จะไม่พร้อมให้ใช้งานเป็นเวลาสี่ถึงแปดนาทีของช่วงเวลาที่ปรับขนาด ด้วยความยืดหยุ่นในการเก็บข้อมูลของ Redshift RA3 ในพื้นที่จัดเก็บที่มีการจัดการ คลัสเตอร์จะพร้อมให้ใช้งานได้อย่างเต็มที่ และข้อมูลจะถูกย้ายระหว่างพื้นที่จัดเก็บที่มีการจัดการกับโหนดประมวลผลโดยอัตโนมัติ

Elastic Resize จะเพิ่มหรือลบโหนดจากคลัสเตอร์ Redshift เดียวภายในไม่กี่นาทีเพื่อจัดการกับอัตราการโอนถ่ายข้อมูลการสืบค้น ตัวอย่างเช่น เวิร์กโหลด ETL สำหรับจำนวนชั่วโมงที่กำหนดในการรายงานแบบต่อวันหรือสิ้นเดือนอาจจำเป็นต้องใช้ทรัพยากร Amazon Redshift เพิ่มเติมเพื่อให้เสร็จสมบูรณ์ทันเวลา การปรับขนาดพร้อมกันจะเพิ่มทรัพยากรคลัสเตอร์เพิ่มเติมเพื่อเพิ่มความสามารถในการทำงานพร้อมกันของการสืบค้นโดยรวม

ไม่ได้ การปรับขนาดพร้อมกันเป็นแหล่งรวมทรัพยากรขนาดใหญ่ของ Amazon Redshift และลูกค้าไม่สามารถเข้าถึงได้โดยตรง

การรักษาความปลอดภัย

Amazon Redshift รองรับความปลอดภัยระดับชั้นนำของอุตสาหกรรมด้วยการผสานรวมการจัดการข้อมูลระบุตัวตนและระบบเชื่อมโยงข้อมูลสำหรับการเข้าสู่ระบบครั้งเดียว (SSO), การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA), การควบคุมการเข้าถึงระดับคอลัมน์, การรักษาความปลอดภัยระดับแถว, การควบคุมการเข้าถึงตามบทบาท และ Amazon Virtual Private Cloud (Amazon VPC) Amazon Redshift ช่วยเข้ารหัสข้อมูลของคุณในขณะที่ถ่ายโอนและจัดเก็บ คุณสมบัติด้านการรักษาความปลอดภัยทั้งหมดของ Amazon Redshift พร้อมใช้งานได้ทันทีโดยไม่ต้องมีค่าใช้จ่ายเพิ่มเติมเพื่อตอบสนองความต้องการด้านการรักษาความปลอดภัย ความเป็นส่วนตัว และการปฏิบัติตามข้อกำหนดที่เข้มงวดที่สุด คุณจะได้สัมผัสข้อดีจาก AWS ที่สนับสนุนมาตรฐานความปลอดภัยและใบรับรองการปฏิบัติตามข้อกำหนดมากกว่าผู้ให้บริการรายอื่นๆ รวมถึง ISO 27001, SOC, HIPAA/HITECH และ FedRAMP

ใช่ Amazon Redshift รองรับการควบคุมการเข้าถึงตามบทบาท การควบคุมการเข้าถึงในระดับแถวจะช่วยให้คุณกำหนดอย่างน้อยหนึ่งบทบาทให้แก่ผู้ใช้ได้ และกำหนดสิทธิ์อนุญาตของระบบและอ็อบเจกต์ตามบทบาท คุณสามารถใช้บทบาทของระบบได้ทันที ไม่ว่าจะเป็นผู้ใช้ที่มีสิทธิ์ใช้งานสูงสุด, DBA, ผู้ปฏิบัติงาน และผู้ดูแลระบบความปลอดภัย หรือจะสร้างบทบาทของคุณเองก็ได้

ฟังก์ชันที่กำหนดโดยผู้ใช้ของ AWS Lambda (UDF) ช่วยให้คุณสามารถใช้ฟังก์ชัน AWS Lambda เป็น UDF ใน Amazon Redshift และเรียกใช้จากการสืบค้นบน Redshift SQL ได้ ฟังก์ชันนี้ช่วยให้คุณสามารถเขียนส่วนขยายแบบกำหนดเองสำหรับการสืบค้น SQL ของคุณ เพื่อให้สามารถผสานรวมเข้ากับบริการอื่นๆ หรือผลิตภัณฑ์จากบุคคลภายนอกได้ดียิ่งขึ้น คุณสามารถเขียน Lambda UDF เพื่อเปิดใช้งานการสร้างโทเค็นภายนอก การมาสก์ข้อมูล การระบุตัวตนหรือการไม่ระบุตัวตนของข้อมูลโดยการผสานรวมกับผู้จัดจำหน่าย เช่น Protegrity และปกป้องหรือยกเลิกการปกป้องข้อมูลที่ละเอียดอ่อนตามสิทธิ์และกลุ่มของผู้ใช้ในระหว่างเวลาสืบค้น

การรองรับการมาสก์ข้อมูลแบบไดนามิกช่วยให้ลูกค้าปกป้องข้อมูลที่ละเอียดอ่อนได้อย่างง่ายดายและควบคุมการเข้าถึงอย่างละเอียดด้วยการจัดการนโยบายการมาสก์ข้อมูล สมมติว่าคุณมีแอปพลิเคชันที่มีผู้ใช้และอ็อบเจกต์หลายรายซึ่งมีข้อมูลที่ละเอียดอ่อนที่ไม่สามารถเปิดเผยต่อผู้ใช้ทั้งหมดได้ คุณมีข้อกำหนดในการจัดเตรียมระดับความปลอดภัยอย่างละเอียดที่แตกต่างกัน ซึ่งคุณต้องการใช้กับผู้ใช้กลุ่มต่างๆ Redshift Dynamic Data Masking สามารถกำหนดค่าได้เพื่ออนุญาตให้ลูกค้ากำหนดค่าข้อมูลที่มาสก์ในแบบที่สอดคล้องกัน รักษารูปแบบ และเปลี่ยนกลับไม่ได้ เมื่อคุณสมบัตินี้เป็น GA คุณจะเริ่มใช้งานได้ทันที ผู้ดูแลระบบด้านการรักษาความปลอดภัยสามารถสร้างและใช้นโยบายด้วยคำสั่งเพียงเล็กน้อย

ใช่ ลูกค้าที่ต้องการใช้ผู้ให้บริการข้อมูลประจำตัวสำหรับองค์กร เช่น Microsoft Azure Active Directory, Active Directory Federation Services, Okta, Ping Federate หรือผู้ให้บริการข้อมูลประจำตัวที่เป็นไปตามมาตรฐาน SAML อื่นๆ สามารถกำหนดค่า Amazon Redshift ให้รองรับการเข้าสู่ระบบครั้งเดียวได้ คุณสามารถเข้าสู่ระบบคลัสเตอร์ Amazon Redshift ได้ด้วยข้อมูลประจำตัวของ Microsoft Azure Active Directory (AD) วิธีนี้จะช่วยให้คุณสามารถเข้าสู่ระบบ Redshift โดยไม่ซ้ำซ้อนกับข้อมูลประจำตัวของ Azure Active Directory ใน Redshift

ใช่ คุณสามารถใช้การยืนยันตัวตนโดยใช้หลายปัจจัย (MFA) เพื่อเพิ่มความปลอดภัยในการตรวจสอบสิทธิ์เพื่อเข้าสู่คลัสเตอร์ Amazon Redshift

ความพร้อมใช้งานและความคงทน

Amazon Redshift จะตรวจจับและเปลี่ยนโหนดที่ทำงานล้มเหลวในคลัสเตอร์คลังข้อมูลของคุณโดยอัตโนมัติ บนคลัสเตอร์ Dense Compute (DC) และ Dense Storage (DS2) ข้อมูลจะถูกเก็บไว้ในโหนดประมวลผลเพื่อให้แน่ใจว่าข้อมูลจะมีความทนทานสูง เมื่อเปลี่ยนโหนดแล้ว ระบบจะรีเฟรชข้อมูลจากสำเนาบนโหนดอื่น คลัสเตอร์ RA3 และ Redshift ที่ไม่ต้องใช้เซิร์ฟเวอร์จะไม่ได้รับผลกระทบในลักษณะเดียวกันนี้ เนื่องจากข้อมูลถูกจัดเก็บไว้ใน Amazon S3 และไดรฟ์ในเครื่องเป็นเพียงแคชข้อมูลเท่านั้น คลัสเตอร์คลังข้อมูลจะไม่สามารถใช้งานในการสืบค้นและไม่สามารถอัปเดตได้จนกว่าระบบจะจัดเตรียมโหนดเปลี่ยนแทนให้และเพิ่มโหนดไปยังฐานข้อมูล Amazon Redshift ช่วยให้สามารถใช้งานโหนดเปลี่ยนแทนได้ทันทีและโหลดข้อมูลที่มีการเข้าถึงบ่อยที่สุดจาก Amazon S3 ก่อน เพื่อให้คุณดำเนินการสืบค้นข้อมูลของคุณต่อได้อย่างรวดเร็วที่สุด คลัสเตอร์โหนดแบบเดี่ยวไม่รองรับการทำสำเนาข้อมูล ในกรณีที่ไดรฟ์หยุดทำงาน คุณต้องกู้คืนคลัสเตอร์จากสแนปช็อตบน S3 เราแนะนำให้ใช้อย่างน้อยสองโหนดสำหรับการทำสำเนาข้อมูล

หากคลังข้อมูล Amazon Redshift ของ Availability Zone เป็นการนำไปใช้แบบ Single-AZ และ Availability Zone ของคลัสเตอร์ไม่พร้อมใช้งาน Amazon Redshift จะย้ายคลัสเตอร์ของคุณไปยัง AWS Availability Zone (AZ) อื่นโดยอัตโนมัติโดยไม่มีการสูญเสียข้อมูลหรือเปลี่ยนแปลงแอปพลิเคชัน โดยคุณต้องเปิดใช้งานความสามารถในการย้ายระบบในการตั้งค่าคลัสเตอร์เพื่อเปิดใช้ฟังก์ชันนี้

ตอนนี้ลูกค้าสามารถปรับปรุงความพร้อมใช้งานของ Redshift ได้โดยเรียกใช้คลังข้อมูลในการใช้งานอินสแตนซ์แบบ Multi-AZ ซึ่งแตกต่างจากการนำไปใช้แบบ Single-AZ การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยให้คุณเรียกใช้คลังข้อมูลได้ในหลาย AWS Availability Zones (AZ) พร้อมกัน และปฏิบัติงานต่อไปเมื่อเกิดสถานการณ์ที่ต้องหยุดทำงานโดยไม่คาดคิด ไม่ต้องเปลี่ยนแปลงแอปพลิเคชันเพื่อรักษาความต่อเนื่องทางธุรกิจเนื่องจากการใช้งานอินสแตนซ์แบบ Multi-AZ ได้รับการจัดการเป็นคลังข้อมูลเดียวที่มีตำแหน่งข้อมูลเดียว การใช้งานอินสแตนซ์แบบ Multi-AZ ช่วยลดเวลาการกู้คืนโดยรับประกันความสามารถในการกู้คืนโดยอัตโนมัติ และเหมาะสำหรับลูกค้าที่มีแอปพลิเคชันการวิเคราะห์ที่สำคัญต่อธุรกิจ ซึ่งต้องการความพร้อมใช้งานและความสามารถในการฟื้นตัวต่อการหยุดทำงานของ AZ ในระดับสูง ซึ่งยังช่วยให้ลูกค้าสามารถใช้โซลูชันที่สอดคล้องกับคำแนะนำของ Reliability Pillar ของเฟรมเวิร์ก AWS Well-Architected ได้มากขึ้น หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Amazon Redshift Multi-AZ โปรดดูที่นี่

RPO ย่อมาจาก Recovery Point Objective และเป็นคำที่ใช้อธิบายการรับประกันความใหม่ของข้อมูลในกรณีที่หยุดทำงาน RPO คือระยะเวลาสูงสุดที่ยอมรับได้ นับจากจุดกู้คืนข้อมูลล่าสุด ซึ่งจะกำหนดสิ่งที่พิจารณาว่าเป็นการสูญหายของข้อมูลที่ยอมรับได้ระหว่างจุดกู้คืนล่าสุดและการหยุดชะงักของบริการ Redshift Multi-AZ รองรับ RPO = 0 หมายความว่าข้อมูลจะรับประกันว่าเป็นข้อมูลล่าสุดและเป็นปัจจุบันในกรณีที่หยุดทำงาน การทดสอบก่อนการเปิดตัวของเราพบว่า RTO ที่มีการปรับใช้การใช้งานอินสแตนซ์แบบ Multi-AZ ของ Amazon Redshift นั้นใช้เวลาน้อยกว่า 60 วินาทีหรือน้อยกว่าในกรณีที่เกิดความล้มเหลวของ AZ ซึ่งไม่น่าจะเกิดขึ้นได้

Redshift Relocation จะเปิดใช้งานเป็นค่าเริ่มต้นบนคลัสเตอร์ RA3 ใหม่และตำแหน่งข้อมูลแบบไม่ต้องใช้เซิร์ฟเวอร์ทั้งหมด ซึ่งช่วยให้คลังข้อมูลสามารถเริ่มต้นใหม่ใน AZ อื่นได้ในกรณีที่เกิดการหยุดทำงานขนาดใหญ่ โดยไม่สูญเสียข้อมูลหรือค่าใช้จ่ายเพิ่มเติม แม้ว่าการใช้คุณสมบัติย้ายระบบจะไม่มีค่าใช้จ่าย แต่ก็มีข้อจำกัด เพราะเป็นวิธีที่พยายามอย่างเต็มที่โดยขึ้นอยู่กับความพร้อมใช้งานของทรัพยากรใน AZ ที่กู้คืน และระยะเวลาที่ใช้ในการกู้คืนข้อมูล (RTO) อาจได้รับผลกระทบจากปัญหาอื่นที่เกี่ยวข้องกับการเริ่มต้นคลัสเตอร์ใหม่ ซึ่งอาจส่งผลให้ใช้เวลากู้คืนตั้งแต่ 10 ถึง 60 นาที Redshift Multi-AZ รองรับความต้องการความพร้อมใช้งานในระดับสูงโดยมอบ RTO ที่วัดได้ในระดับสิบวินาทีและรับประกันการทำงานต่อเนื่อง เนื่องจากไม่อยู่ภายใต้ข้อจำกัดด้านความจุหรือปัญหาอื่นๆ ที่อาจเกิดขึ้นในการสร้างคลัสเตอร์ใหม่

การสืบค้นและการวิเคราะห์

ได้ Amazon Redshift ใช้ SQL ตามมาตรฐานอุตสาหกรรมและสามารถเข้าถึงได้โดยใช้ไดรฟ์เวอร์ JDBC และ ODBC แบบมาตรฐาน คุณสามารถดาวน์โหลดไดรฟ์เวอร์ JDBC และ ODBC แบบกำหนดเองของ Amazon Redshift ได้จากแท็บ Connect Client ของ Redshift Console เรามีการผสานการทำงานที่ได้รับการตรวจสอบแล้วกับ ผู้จัดจำหน่าย BI และ ETL ยอดนิยม โดยบางรายเสนอ ช่วงทดลองใช้งานฟรี เพื่อช่วยให้คุณสามารถเริ่มใช้งานการโหลดและการวิเคราะห์ข้อมูล นอกจากนั้น คุณยังสามารถไปที่ AWS Marketplace เพื่อติดตั้งใช้จริงและกำหนดค่าโซลูชันที่ได้รับการออกแบบมาเพื่อใช้งานร่วมกับ Amazon Redshift ได้ภายในไม่กี่นาที

Amazon Redshift Spectrum รองรับเครื่องมือไคลเอ็นต์ของ Amazon Redshift ทุกแบบ เครื่องมือไคลเอ็นต์สามารถเชื่อมต่อกับตำแหน่งข้อมูลของคลัสเตอร์ Amazon Redshift ต่อไปได้โดยใช้การเชื่อมต่อ ODBC หรือ JDBC ไม่จำเป็นต้องปรับเปลี่ยนใดๆ

คุณต้องใช้โครงสร้างและความสามารถในการสืบค้นแบบเดียวกันเพื่อเข้าถึงตารางใน Redshift Spectrum ตามที่คุณมีสำหรับตารางในพื้นที่จัดเก็บภายในคลัสเตอร์ Redshift ของคุณ โดยระบบจะอ้างอิงตารางภายนอกโดยใช้ชื่อสคีมาที่กำหนดไว้ในคำสั่ง CREATE EXTERNAL SCHEMA ในที่ซึ่งลงทะเบียนคำสั่งเอาไว้

ปัจจุบัน Amazon Redshift Spectrum รองรับรูปแบบข้อมูลแบบโอเพนซอร์สหลากหลายแบบด้วยกัน ได้แก่ Avro, CSV, Grok, Amazon Ion, JSON, ORC, Parquet, RCFile, RegexSerDe, Sequence, Text และ TSV <br>ปัจจุบัน Amazon Redshift Spectrum รองรับการบีบอัด Gzip และ Snappy

คุณสามารถใช้ชื่อสคีมาในการเลือกตารางที่คุณต้องการโดยใช้ schema_name.table_name ในการสืบค้น เหมือนที่ทำกับตารางภายใน

ใช่ คำสั่ง CREATE EXTERNAL SCHEMA รองรับ Hive Metastore แต่เราไม่ยังไม่รองรับ DDL สำหรับ Hive Metastore ในตอนนี้

คุณสามารถสืบค้นตารางระบบ SVV_EXTERNAL_TABLES เพื่อรับข้อมูลดังกล่าวได้

ใช่ คุณสมบัติ Amazon Redshift ML ช่วยให้ผู้ใช้ SQL สามารถสร้าง ฝึกอบรม และติดตั้งใช้งานโมเดลแมชชีนเลิร์นนิง (ML) ได้อย่างง่ายดายด้วยการใช้คำสั่ง SQL ที่คุ้นเคย Amazon Redshift ML ช่วยให้คุณสามารถใช้ประโยชน์จากข้อมูลของคุณใน Amazon Redshift ด้วย Amazon SageMaker ซึ่งเป็นบริการ ML ที่มีการจัดการอย่างเต็มรูปแบบ Amazon Redshift รองรับทั้งการเรียนรู้แบบไม่มีผู้ดูแล (K-Means) และการเรียนรู้แบบมีผู้ดูแล (อัลกอริทึม Autopilot, XGBoost, MLP) คุณยังสามารถใช้บริการ AI ด้านภาษาของ AWS เพื่อแปล ตรวจทาน และวิเคราะห์ช่องข้อความในการสืบค้น SQL ด้วยฟังก์ชัน Lambda UDF ที่สร้างไว้ล่วงหน้าได้ด้วย ดูบล็อกโพสต์

Amazon Redshift มี Data API ที่คุณสามารถเข้าถึงข้อมูลได้อย่างสะดวกจาก Amazon Redshift ด้วยแอปพลิเคชัน Cloud-Native แบบดั้งเดิมทุกประเภท บริการบนเว็บแบบไม่ต้องใช้เซิร์ฟเวอร์และอยู่ในคอนเทนเนอร์ รวมถึงแอปพลิเคชันที่ขับเคลื่อนด้วยเหตุการณ์ Data API ช่วยลดความซับซ้อนในการเข้าถึง Amazon Redshift เนื่องจากคุณไม่จำเป็นต้องกำหนดค่าไดรฟ์เวอร์และจัดการการเชื่อมต่อฐานข้อมูล คุณสามารถเรียกใช้คำสั่ง SQL ไปยังคลัสเตอร์ Amazon Redshift ได้อย่างง่ายดายเพียงแค่เรียกตำแหน่งข้อมูล API ที่ปลอดภัยซึ่งได้รับจาก Data API Data API ดูแลในส่วนของการจัดการการเชื่อมต่อฐานข้อมูลและการบัฟเฟอร์ข้อมูล และ Data API เป็นแบบอะซิงโครนัส คุณจึงสามารถดึงผลลัพธ์ได้ในภายหลัง ผลการสืบค้นของคุณจะถูกจัดเก็บไว้เป็นเวลา 24 ชั่วโมง

Data API รองรับทั้งข้อมูลประจำตัว IAM และข้อมูลประจำตัวที่ใช้คีย์ลับจาก AWS Secrets Manager Data API รวมเข้ากับข้อมูลประจำตัว AWS Identity and Access Management (IAM) ดังนั้นคุณจึงสามารถใช้งานผู้ให้บริการข้อมูลประตัวอย่าง Okta หรือ Azure Active Directory หรือข้อมูลประจำตัวฐานข้อมูลที่จัดเก็บใน Secrets Manager โดยไม่ต้องผ่านข้อมูลประจำตัวฐานข้อมูลในการเรียกใช้ API

ได้ คุณสามารถใช้ Data API จาก AWS CLI โดยใช้ตัวเลือกบรรทัดคำสั่งที่เป็นข้อมูลของ AWS Redshift ได้

คุณสามารถใช้ Data API จากบริการอื่น เช่น AWS Lambda, AWS Cloud9, AWS AppSync และ Amazon EventBridge ได้

ไม่ Data API ไม่มีค่าบริการแยกต่างหาก

การบูรณาการ ETL แบบไร้รอยต่อ

Amazon Aurora รุ่นใช้งานร่วมกันได้กับ MySQL, Amazon Aurora รุ่นใช้งานร่วมกันได้กับ PostgreSQL (ตัวอย่าง), Amazon RDS สำหรับ MySQL และ Amazon DynamoDB (ตัวอย่างแบบจำกัด) รองรับการการบูรณาการ ETL แบบไร้รอยต่อกับ Amazon Redshift

คุณควรใช้ การบูรณาการ ETL แบบไร้รอยต่อของ Aurora กับ Amazon Redshift เมื่อคุณต้องการเข้าถึงข้อมูลธุรกรรมแบบเกือบเรียลไทม์ การบูรณาการนี้ช่วยให้คุณใช้ประโยชน์จาก Amazon Redshift ML ด้วยคำสั่ง SQL ที่ตรงไปตรงมาได้

การบูรณาการ ETL แบบไร้รอยต่อของ Aurora กับ Amazon Redshift พร้อมให้ใช้งานใน Aurora MySQL รุ่นที่ใช้งานร่วมกับ Aurora MySQL เวอร์ชัน 3.05 (ใช้งานร่วมกันได้กับ MySQL 8.0.32) และสูงกว่าใน AWS Region ที่รองรับ

การบูรณาการ ETL แบบไร้รอยต่อของ Aurora กับ Amazon Redshift พร้อมให้ใช้งานใน Aurora รุ่นที่ใช้งานร่วมกับ PostgreSQLได้สำหรับ Aurora PostgreSQL 15.4 ในรีเจี้ยนสหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ)

การบูรณาการ ETL แบบไร้รอยต่อของ Aurora กับ Amazon Redshift ทำให้คุณไม่จำเป็นต้องสร้างและบำรุงรักษาไปป์ไลน์ข้อมูลที่มีความซับซ้อน คุณสามารถรวมข้อมูลจากคลัสเตอร์ฐานข้อมูล Aurora เดียวหรือหลายคลัสเตอร์ไปยังคลัสเตอร์ฐานข้อมูล Amazon Redshift เดียว และเรียกใช้การวิเคราะห์และ ML แบบใกล้เคียงเรียลไทม์โดยใช้ Amazon Redshift บนข้อมูลธุรกรรมระดับเพตะไบต์จาก Aurora

การบูรณาการ ETL แบบไร้รอยต่อของ Aurora กับ Amazon Redshift สามารถใช้งานร่วมกันได้กับ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์และ Amazon Aurora Serverless v2 เมื่อใช้ทั้ง Aurora Serverless v2 และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ คุณจะสามารถสร้างการวิเคราะห์ข้อมูลธุรกรรมแบบเกือบเรียลไทม์ได้โดยไม่ต้องจัดการโครงสร้างพื้นฐานใดๆ สําหรับไปป์ไลน์ข้อมูล

คุณสามารถเริ่มต้นได้โดยใช้คอนโซล Amazon RDS เพื่อสร้างการบูรณาการ ETL แบบไร้รอยต่อผ่านการระบุต้นทาง Aurora และปลายทาง Amazon Redshift เมื่อสร้างการผสานรวมแล้ว ฐานข้อมูล Aurora จะถูกจำลองไปยัง Amazon Redshift และคุณจะสามารถเริ่มสืบค้นข้อมูลได้เมื่อการเริ่มต้นเสร็จสมบูรณ์แล้ว สําหรับข้อมูลเพิ่มเติม โปรดอ่านคู่มือเริ่มต้นใช้งานสําหรับการบูรณาการ ETL แบบไร้รอยต่อของ Amazon Aurora MySQL กับ Amazon Redshift

การรวม Aurora กับ Amazon Redshift แบบการผสานรวม ETL แบบไร้รอยต่อ จะจำลองธุรกรรมเชิงโครงสร้างเพื่อให้มั่นใจว่าความสอดคล้องกันของข้อมูลระหว่างฐานข้อมูล Aurora ต้นทางและคลัสเตอร์ Amazon Redshift เป้าหมาย
ต่อไปนี้เป็นประเด็นสำคัญบางประการเกี่ยวกับความเป็นอะตอมของธุรกรรมด้วยการผสานการทำงานนี้:

  • เฉพาะธุรกรรมที่ผูกมัดใน Aurora เท่านั้นที่จะทำซ้ำไปยัง Amazon Redshift จะไม่นำไปใช้ธุรกรรมที่ไม่มีข้อผูกมัดหรือแบบย้อนกลับ
  • การผสานรวมใช้กระบวนการผูกมัดแบบสองเฟสเพื่อนำแต่ละธุรกรรมไปใช้กับ Amazon Redshift แบบเชิงโครงสร้าง โดยระบบจะนำการเปลี่ยนแปลงข้อมูลทั้งหมดในการทำธุรกรรมจะไปใช้ หรือหากเกิดข้อผิดพลาดก็จะไม่มีการนำไปใช้เลย
  • ความสอดคล้องของธุรกรรมจะคงอยู่ระหว่างแหล่งที่มาและเป้าหมาย หลังจากการจำลองข้อมูล ข้อมูลสำหรับธุรกรรมที่กำหนดจะสอดคล้องกันทั้งใน Aurora และ Amazon Redshift
  • การเปลี่ยนแปลงโครงสร้างข้อมูลผ่าน DDL หรือ DML ยังถูกนำไปใช้แบบเชิงโครงสร้างเพื่อรักษาความสมบูรณ์
  • การประยุกต์ใช้ธุรกรรมแบบอะตอมช่วยให้มั่นใจว่าจะไม่มีธุรกรรมบางส่วนหรือสถานะข้อมูลที่ไม่สอดคล้องกันเกิดขึ้นระหว่างฐานข้อมูล
 

การบูรณาการ ETL แบบไร้รอยต่อของ Aurora กับ Amazon Redshift จะรักษาความสอดคล้องของธุรกรรมอย่างสมบูรณ์ระหว่างฐานข้อมูล Aurora ต้นทางและคลัสเตอร์ Amazon Redshift เป้าหมาย

ต่อไปนี้เป็นประเด็นสำคัญบางประการเกี่ยวกับวิธีการจัดการการเปลี่ยนแปลงโครงสร้างข้อมูล:

  • คำสั่ง DDL เช่น CREATE TABLE, ALTER TABLE, DROP TABLE และอื่น ๆ จะได้รับการจำลองโดยอัตโนมัติจาก Aurora ไปยัง Amazon Redshift
  • การผสานรวมทำให้เกิดการตรวจสอบและการปรับเปลี่ยนที่จำเป็นในตาราง Amazon Redshift สำหรับการเปลี่ยนแปลงโครงสร้างข้อมูลข้อมูลที่จำลองไว้ ตัวอย่างเช่นการเพิ่มคอลัมน์ใน Aurora จะเพิ่มคอลัมน์ใน Amazon Redshift ด้วย
  • การจำลองแบบและการซิงค์โครงสร้างข้อมูลจะเกิดขึ้นแบบเรียลไทม์โดยอัตโนมัติ โดยมีความล่าช้าน้อยที่สุดระหว่างฐานข้อมูลต้นทางและเป้าหมาย
  • ความสอดคล้องของโครงสร้างข้อมูลจะคงอยู่แม้ว่าการเปลี่ยนแปลง DML เกิดขึ้นควบคู่ไปกับการเปลี่ยนแปลง DDL

คุณสามารถสร้างมุมมองผลการสืบค้นในฐานข้อมูล Amazon Redshift ในระบบท้องถิ่นของคุณเพื่อแปลงข้อมูลที่จำลองผ่านการผสานรวม ETL แบบไร้รอยต่อ เชื่อมต่อกับฐานข้อมูลท้องถิ่นของคุณและใช้การสืบค้นข้ามฐานข้อมูลเพื่อเข้าถึงฐานข้อมูลปลายทาง คุณสามารถใช้ชื่ออ็อบเจ็กต์ที่มีคุณสมบัติครบถ้วนพร้อมหมายเหตุประกอบสามส่วน (destination-database-name.schema-name.table-name) หรือสร้างโครงสร้างข้อมูลภายนอกอ้างอิงฐานข้อมูลปลายทางและคู่โครงสร้างข้อมูล และใช้หมายเหตุประกอบสองส่วน (external-schema-name.table-name) ได้

การบูรณาการ ETL แบบไร้รอยต่อและการประมวลผลการเปลี่ยนแปลงข้อมูลอย่างต่อเนื่องไม่มีค่าใช้จ่ายเพิ่มเติม ระบบจะเรียกเก็บค่าบริการทรัพยากร Amazon RDS และ Amazon Redshift ที่มีอยู่ที่ใช้ในการสร้างและประมวลผลข้อมูลการเปลี่ยนแปลงที่สร้างขึ้นโดยเป็นส่วนหนึ่งของการบูรณาการ ETL แบบไร้รอยต่อ ทรัพยากรเหล่านี้อาจรวมถึงสิ่งต่อไปนี้

  • I/O เพิ่มเติมและพื้นที่เก็บข้อมูลที่ใช้โดยการเปิดใช้งาน Binlog ที่ได้รับการปรับปรุงแล้ว
  • ค่าใช้จ่ายในการส่งออกสแนปชอตสำหรับการส่งออกข้อมูลเบื้องต้นไปยังฐานข้อมูล Amazon Redshift ของคุณ
  • พื้นที่จัดเก็บเพิ่มเติมของ Amazon Redshift สำหรับการจัดเก็บข้อมูลที่มีการจำลองแบบ
  • ค่าใช้จ่ายในการถ่ายโอนข้อมูล Cross-AZ สำหรับการย้ายข้อมูลจากต้นทางไปยังปลายทาง

สําหรับข้อมูลเพิ่มเติม โปรดไปที่หน้าราคาของ Amazon Aurora

หากต้องการดูคำถามที่พบบ่อยเกี่ยวกับ Amazon RDS สำหรับการบูรณาการ ETL แบบไร้รอยต่อของ MySQL กับ Amazon Redshift โปรดดูคำถามที่พบบ่อยเกี่ยวกับ Amazon RDS สำหรับ MySQL หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับราคาสำหรับการผสานการทำงานนี้ โปรดดู หน้าราคา Amazon RDS สำหรับ MySQL

การสำรองและการกู้คืนข้อมูล

คลัสเตอร์ Amazon Redshift RA3 และ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์ใช้ Redshift Managed Storage ซึ่งมีสำเนาล่าสุดของข้อมูลอยู่เสมอ คลัสเตอร์ DS2 และ DC2 ทำสำเนาข้อมูลบนคลัสเตอร์เพื่อให้แน่ใจว่าสำเนาล่าสุดจะพร้อมใช้งานในกรณีที่เกิดการหยุดทำงาน ระบบจะสร้างการสำรองข้อมูลขึ้นโดยอัตโนมัติในคลัสเตอร์ Redshift ทุกประเภทและจะคงไว้เป็นเวลา 24 ชั่วโมง และจุดกู้คืนแบบไม่ต้องใช้เซิร์ฟเวอร์จะสำรองข้อมูลไว้ในช่วง 24 ชั่วโมงที่ผ่านมา

และคุณยังสามารถสร้างข้อมูลสำรองของคุณเองที่สามารถเก็บไว้ได้อย่างไม่มีกำหนดด้วยเช่นกัน ข้อมูลสำรองเหล่านี้สร้างขึ้นได้ทุกเมื่อและสามารถแปลงข้อมูลสำรองอัตโนมัติจากจุดกู้คืนของ Amazon Redshift หรือ Amazon Redshift แบบไม่ต้องใช้เซิร์ฟเวอร์เป็นข้อมูลสำรองของผู้ใช้ได้เพื่อเก็บรักษาให้ยาวนานขึ้น

Amazon Redshift ยังสามารถจำลองสแนปช็อตหรือจุดกู้คืนของคุณแบบไม่พร้อมกันไปยัง Amazon S3 ใน Region อื่นสำหรับกระบวนการกู้คืนจากความเสียหาย

บนคลัสเตอร์ DS2 หรือ DC2 ระบบจะจำกัดพื้นที่จัดเก็บข้อมูลสำรองฟรีตามพื้นที่จัดเก็บทั้งหมดบนโหนดในคลัสเตอร์คลังเก็บข้อมูล และจะนำไปใช้เฉพาะกับคลัสเตอร์คลังเก็บข้อมูลที่เปิดใช้งานอยู่เท่านั้น

ตัวอย่างเช่น หากคุณมีพื้นที่คลังเก็บข้อมูลทั้งหมด 8 TB เราจะจัดเตรียมพื้นที่จัดเก็บข้อมูลสำรองให้สูงสุด 8 TB โดยไม่มีค่าบริการเพิ่มเติม หากคุณต้องการขยายระยะเวลาเก็บรักษาข้อมูลสำรองไปเกินหนึ่งวัน คุณสามารถขยายระยะเวลาได้โดยใช้ คอนโซลการจัดการของ AWS หรือ API ของ Amazon Redshift หากต้องการดูข้อมูลเพิ่มเติมเกี่ยวกับสแนปช็อตอัตโนมัติ โปรดดูที่คู่มือการจัดการ Amazon Redshift

Amazon Redshift จะสำรองเฉพาะข้อมูลที่มีการเปลี่ยนแปลงเท่านั้น ดังนั้นสแนปช็อตส่วนใหญ่จึงใช้พื้นที่จัดเก็บข้อมูลสำรองฟรีเพียงเล็กน้อย หากคุณต้องการกู้คืนข้อมูลสำรอง คุณสามารถเข้าถึงทุกการสำรองข้อมูลอัตโนมัติได้ในหน้าต่างการเก็บรักษาข้อมูลสำรอง เมื่อคุณเลือกได้ว่าจะกู้คืนข้อมูลสำรองใด เราจะจัดเตรียมคลัสเตอร์คลังข้อมูลใหม่ให้และกู้คืนข้อมูลของคุณไปยังคลัสเตอร์ดังกล่าว

คุณสามารถใช้ คอนโซลการจัดการของ AWS หรือ API ModifyCluster เพื่อจัดการระยะเวลาที่ข้อมูลสำรองอัตโนมัติของคุณจะถูกเก็บไว้ได้โดยการแก้ไขพารามิเตอร์ RetentionPeriod หากคุณต้องการปิดข้อมูลสำรองอัตโนมัติทั้งหมด สามารถทำได้โดยกำหนดระยะเวลาการเก็บข้อมูลเป็น 0 (ไม่แนะนำ)

หากคุณลบคลัสเตอร์คลังข้อมูล คุณจะสามารถระบุได้ว่าจะสร้างสแนปช็อตสุดท้ายเมื่อดำเนินการลบหรือไม่ ซึ่งช่วยให้สามารถกู้คืนคลัสเตอร์คลังข้อมูลที่ลบทิ้งไปแล้วได้ในภายหลัง สแนปช็อตแบบแมนนวลของคลัสเตอร์คลังข้อมูลที่สร้างไว้ก่อนหน้านี้ทั้งหมดจะได้รับการเก็บรักษาไว้และเรียกเก็บเงินตาม อัตราค่าบริการมาตรฐานของ Amazon S3 เว้นแต่คุณเลือกที่จะลบออก

การเฝ้าติดตามและการบำรุงรักษา

ตัวชี้วัดสำหรับการใช้งานการประมวลผล การใช้งานพื้นที่จัดเก็บ และปริมาณการเขียน/อ่านข้อมูลในคลัสเตอร์คลังข้อมูล Amazon Redshift สามารถใช้งานได้ฟรีผ่าน คอนโซลการจัดการของ AWS หรือ API ของ Amazon CloudWatch และคุณยังสามารถเพิ่มตัวชี้วัดตามผู้ใช้กำหนดเพิ่มเติมผ่านฟังก์ชันตัวชี้วัดแบบกำหนดเองของ Amazon CloudWatch ได้อีกด้วย คอนโซลการจัดการของ AWS มีแดชบอร์ดการติดตามสำหรับช่วยคุณติดตามสภาพและประสิทธิภาพของคลัสเตอร์ทั้งหมดของคุณ นอกจากนี้ Amazon Redshift ยังมอบข้อมูลเกี่ยวกับประสิทธิภาพของการสืบค้นและคลัสเตอร์ผ่านคอนโซลการจัดการของ AWS อีกด้วย ข้อมูลนี้ช่วยให้คุณสามารถดูได้ว่าผู้ใช้และการสืบค้นใดที่กำลังใช้งานทรัพยากรระบบมากที่สุดเพื่อดำเนินการวิเคราะห์ปัญหาด้านประสิทธิภาพโดยดูแผนการสืบค้นและสถิติการดำเนินการ อีกทั้งคุณยังเห็นการใช้ทรัพยากรบนโหนดประมวลผลแต่ละตัว เพื่อดูว่าคุณมีข้อมูลและการสืบค้นที่สมดุลกันบนทุกโหนดหรือไม่

Amazon Redshift จะดำเนินการบำรุงรักษาเป็นครั้งคราวเพื่อปรับใช้การแก้ไข การปรับปรุง และคุณสมบัติใหม่ๆ ให้กับคลัสเตอร์ของคุณ คุณสามารถเปลี่ยนระยะเวลาบำรุงรักษาตามกำหนดได้โดยการแก้ไขคลัสเตอร์ทั้งทางโปรแกรมหรือโดยใช้ Redshift Console โดยจะไม่สามารถใช้งานคลัสเตอร์ Amazon Redshift ในการทำงานทั่วไปได้ระหว่างระยะเวลาการบำรุงรักษา สำหรับข้อมูลเพิ่มเติมเกี่ยวกับระยะเวลาบำรุงรักษาและกำหนดการตาม Region โปรดดูที่ ระยะเวลาบำรุงรักษา ในคู่มือการจัดการ Amazon Redshift