การสืบค้นข้อมูล SQL

การสืบค้น SQL กับความจุที่จัดสรรไว้

Apache Spark

ค่าใช้จ่ายเพิ่มเติม

Athena จะสืบค้นข้อมูลโดยตรงจาก Amazon S3 ไม่มีค่าบริการพื้นที่จัดเก็บเพิ่มเติมสำหรับการสืบค้นข้อมูลของคุณด้วย Athena คุณจะเสียค่าบริการ S3 ในอัตรามาตรฐานสำหรับพื้นที่จัดเก็บ คำขอ และการโอนถ่ายข้อมูล ตามค่าเริ่มต้น ผลการสืบค้นจัดเก็บอยู่ในบัคเก็ต S3 ที่คุณเลือกและยังมีการเรียกเก็บค่าบริการตามอัตรา S3 แบบมาตรฐาน

  • S3 จะเรียกเก็บเงินเมื่อเวิร์กโหลดอ่าน จัดเก็บ และถ่ายโอนข้อมูล ซึ่งรวมถึงการสืบค้นที่สำเร็จและไม่สำเร็จ ตามค่าเริ่มต้น ผลการสืบค้น SQL และผลการคำนวณ Spark จะจัดเก็บอยู่ในบัคเก็ต S3 ที่คุณเลือก โดยมีการเรียกเก็บค่าบริการตามอัตรา S3 มาตรฐาน ดูข้อมูลเพิ่มเติมได้ที่ราคา Amazon S3
  • หากคุณใช้แค็ตตาล็อกข้อมูลของ AWS Glue กับ Athena จะมีการเรียกเก็บค่าบริการตามอัตราแค็ตตาล็อกข้อมูลของ AWS Glue แบบมาตรฐาน ดูรายละเอียดได้ที่หน้าราคา AWS Glue
  • การสืบค้น SQL บนแหล่งที่มาของข้อมูล (ข้อมูลไม่ได้จัดเก็บใน S3) จะถูกเรียกเก็บค่าบริการต่อเทราไบต์ (TB) ที่สแกนโดย Athena ที่รวบรวมจากแหล่งที่มาของข้อมูลต่าง ๆ โดยปัดขึ้นเป็นเมกะไบต์ที่ใกล้ที่สุดด้วยขั้นต่ำ 10 เมกะไบต์ต่อการสืบค้น เว้นแต่จะใช้ความจุที่จัดสรรไว้ นอกจากนี้ การสืบค้นข้อมูลดังกล่าวยังมีการเรียกใช้ฟังก์ชัน AWS Lambda ในบัญชีของคุณ คุณจึงถูกเรียกเก็บเงินสำหรับการใช้ Lambda ในอัตรามาตรฐาน ฟังก์ชัน Lambda ที่เรียกใช้โดยคิวรีภายนอกจะเป็นไปตาม Free Tier ของ Lambda ดูรายละเอียดได้ที่หน้าราคา Lambda

ตัวอย่างราคา

ตัวอย่างที่ 1 – การสืบค้นข้อมูลของ SQL

ลองพิจารณาตารางที่มีคอลัมน์ขนาดเท่ากัน 4 คอลัมน์ที่จัดเก็บไว้ใน Amazon S3 เป็นไฟล์ข้อความแบบไม่บีบอัด โดยมีขนาดรวม 3 TB การเปิดใช้การสืบค้นข้อมูลเพื่อรับข้อมูลจากคอลัมน์หนึ่งของตารางต้องใช้ Amazon Athena ในการสแกนทั้งไฟล์ เนื่องจากไม่สามารถแยกข้อความได้

  • การสืบค้นนี้จะมีค่าบริการ: 15 USD (ราคาสำหรับการสแกนข้อมูล 3 TB คือ 3 * 5 USD/TB = 15 USD)

หากคุณบีบอัดไฟล์โดยใช้ GZIP คุณอาจได้รับอัตราการบีบอัดที่ 3:1 ในกรณีนี้ คุณจะมีไฟล์บีบอัดขนาด 1 TB การสืบค้นเดียวกันบนไฟล์นี้จะมีค่าบริการ 5 USD Athena ต้องสแกนทั้งไฟล์อีกครั้ง แต่เนื่องจากมีขนาดเล็กลง 3 เท่า คุณจึงจ่ายแค่หนึ่งในสามของการสืบค้นก่อนหน้า หากคุณบีบอัดไฟล์และแปลงไฟล์เป็นรูปแบบคอลัมน์ด้วย เช่น Apache Parquet โดยมีอัตราการบีบอัด 3:1 คุณจะยังได้รับข้อมูลขนาด 1 TB บน S3 แต่ในกรณีนี้ เนื่องจาก Parquet เป็นข้อมูลรูปแบบคอลัมน์ Athena สามารถอ่านได้เฉพาะคอลัมน์ที่มีความเกี่ยวข้องกับการสืบค้นที่เรียกใช้ เนื่องจากการสืบค้นดังกล่าวอ้างอิงเฉพาะคอลัมน์เดียว Athena จะอ่านเฉพาะคอลัมน์นั้นและอาจจะหลีกเลี่ยงการอ่านข้อมูลสามในสี่ของทั้งไฟล์ เนื่องจาก Athena อ่านเพียงหนึ่งในสี่ของไฟล์ จึงสแกนข้อมูลจาก S3 เพียง 0.25 TB

  • การสืบค้นนี้จะมีค่าบริการ: 1.25 USD ประหยัดค่าใช้จ่ายขึ้น 3 เท่าด้วยการบีบอัดและประหยัดค่าใช้จ่ายขึ้น 4 เท่าสำหรับการอ่านข้อมูลเพียงคอลัมน์เดียว 
    (ขนาดไฟล์ = 3 TB/3 = 1 TB ข้อมูลที่สแกนเมื่ออ่านเพียงคอลัมน์เดียว = 1TB/4 = 0.25 TB ราคาสำหรับ 0.25 TB = 0.25 * 5 USD/TB = 1.25 USD)

ตัวอย่างที่ 2 - การสืบค้นข้อมูลของ SQL กับความจุที่จัดสรรไว้

สมมติว่าทีมของคุณสนับสนุนเว็บแอปพลิเคชันที่ให้การวิเคราะห์แบบบริการตนเองแก่ผู้ใช้ที่ส่งการสืบค้นในช่วงเวลาทำการ และคาดว่าการสืบค้นของพวกเขาจะเสร็จสิ้นภายในระยะเวลาที่คาดการณ์ได้ สัปดาห์ที่แล้ว ผู้ใช้แอปพลิเคชันส่งการสืบค้นข้อมูลทั้งหมด 10,000 รายการ ซึ่งเป็นข้อมูลที่สแกนขนาด 500 TB คุณต้องการใช้ความจุที่จัดสรรไว้เพื่อช่วยรักษาประสบการณ์ผู้ใช้ที่สม่ำเสมอเมื่อจำนวนผู้ใช้เพิ่มขึ้น จากการวิเคราะห์การสืบค้นของคุณ คุณพิจารณาว่า 96 DPU เพียงพอสำหรับเวิร์กโหลดปัจจุบันของคุณ

  • สำหรับหนึ่งวันทำการ ค่าใช้จ่ายในการรองรับเวิร์กโหลดนี้ด้วยความจุที่จัดสรระไว้นั้นจะคำนวณเป็น 96 DPU * 0.30 USD ต่อชั่วโมง DPU * 12 ชั่วโมงต่อวัน = 345.60 USD

เช้าวันหนึ่ง คุณได้เรียนรู้ว่าผู้ใช้แอปพลิเคชันชุดใหม่ได้เริ่มต้นใช้งานเรียบร้อยแล้ว และด้วยเหตุนี้ คุณคาดว่าปริมาณการสืบค้นข้อมูลจะสูงกว่าวันก่อนหน้าถึง 2 เท่า คุณต้องการมั่นใจว่าผู้ใช้มีประสิทธิภาพใกล้เคียงกับเมื่อวาน แต่ไม่คิดว่าผู้ใช้ทั้งหมดจะส่งการสืบค้นข้อมูลพร้อมกัน โดยในสองชั่วโมงของแต่ละวัน คุณเพิ่มความจุ 50% เป็น 144 DPU

  • ค่าใช้จ่ายสำหรับเวิร์กโหลดของวันนี้เท่ากับค่าใช้จ่าย 96 DPU เป็นเวลา 2 ชั่วโมง บวก 144 DPU เป็นเวลา 10 ชั่วโมง หรือ 96 DPU * 0.30 USD ต่อชั่วโมง DPU * 2 ชั่วโมง + 144 DPU * 0.30 USD ต่อชั่วโมง DPU * 10 ชั่วโมง = 489.60 USD

ตัวอย่างที่ 3 – แอปพลิเคชัน Apache Spark

ลองพิจารณาใช้โน้ตบุ๊คในคอนโซล Athena เพื่อดึงตัวเลขยอดขายสำหรับไตรมาสก่อนหน้า และสร้างกราฟเพื่อสร้างรายงาน คุณเริ่มเซสชันโดยการใช้โน้ตบุ๊ค เซสชันของคุณใช้เวลา 1 ชั่วโมง และส่งการคำนวณ 6 รายการเป็นส่วนหนึ่งของเซสชัน การคำนวณแต่ละครั้งจะใช้ Worker Node 1-DPU 20 โหนดในการรันและจะใช้เวลา 1 นาที

  • DPU ต่อชั่วโมงของตัวปฏิบัติงาน (Worker) = จำนวนการคำนวณ * DPU ที่ใช้ต่อการคำนวณ * เวลาดำเนินการคำนวณ = การคำนวณ 6 รายการ * 20 DPU ต่อการคำนวณ * (1/60) ชั่วโมงต่อการคำนวณ = 2.0 DPU ต่อชั่วโมง
  • DPU ต่อชั่วโมงของไดรเวอร์ = DPU ที่ใช้ต่อเซสชัน * เวลาเซสชัน = 1 DPU ต่อเซสชัน * 1 ชั่วโมงต่อเซสชัน = 1.0 DPU ต่อชั่วโมง
  • DPU ต่อชั่วโมงทั้งหมด = DPU ต่อชั่วโมงของตัวปฏิบัติงาน (Worker) + DPU ต่อชั่วโมงของไดรเวอร์ = 2.0 DPU ต่อชั่วโมง + 1.0 DPU ต่อชั่วโมง = 3.0 DPU ต่อชั่วโมง
  • ค่าบริการแอปพลิเคชัน Spark = 0.35 USD ต่อชั่วโมง DPU * 3.0 DPU ต่อชั่วโมง = 1.05 USD

หมายเหตุ: S3 จะเรียกเก็บเงินคุณแยกต่างหากสำหรับการจัดเก็บและอ่านข้อมูล รวมถึงผลลัพธ์ของการดำเนินการของคุณ

ข้อมูลราคาเพิ่มเติม

AWS Pricing Calculator

คำนวณต้นทุนรายเดือนอย่างง่ายกับ AWS

รับความช่วยเหลือเกี่ยวกับราคา

ติดต่อผู้เชี่ยวชาญของ AWS เพื่อรับการเสนอราคาแบบส่วนบุคคล

ไปที่หน้าเริ่มต้นใช้งาน

เรียนรู้วิธีเริ่มต้นใช้งาน Amazon Athena

เรียนรู้เพิ่มเติม »
เริ่มต้นสร้างใน Console

เริ่มต้นสร้างด้วย Amazon Athena ในคอนโซลการจัดการของ AWS

ลงชื่อเข้าใช้ »
ติดต่อผู้เชี่ยวชาญ

สำรวจตัวเลือกการสนับสนุนของ Amazon Athena

ติดต่อเรา »