Apache HBase คืออะไร

Apache HBase เป็นที่เก็บข้อมูล Big Data โอเพนซอร์ส NoSQL แบบกระจายตัว ซึ่งช่วยให้สามารถเข้าถึงข้อมูลระดับเพตะไบต์ได้แบบเรียลไทม์ในลักษณะสุ่มและสม่ำเสมออย่างเคร่งครัด HBase มีประสิทธิภาพมากในการจัดการชุดข้อมูลขนาดใหญ่ที่กระจัดกระจาย

HBase ผสานเข้ากับ Apache Hadoop และระบบนิเวศ Hadoop ได้อย่างราบรื่นและทำงานบน Hadoop Distributed File System (HDFS) หรือ Amazon S3 ที่ใช้ระบบไฟล์ Amazon Elastic MapReduce (EMR) หรือ EMRFS HBase ทำหน้าที่เป็นอินพุตและเอาต์พุตของเฟรมเวิร์ก Apache MapReduce สำหรับ Hadoop โดยตรง และทำงานร่วมกับ Apache Phoenix ในการเปิดใช้งานการสืบค้นที่คล้ายกับ SQL บนตาราง HBase 

โลโก้ HBase

HBase ทำงานอย่างไร

HBase เป็นฐานข้อมูลแบบคอลัมน์ที่ไม่ใช่แบบเชิงสัมพันธ์ ซึ่งหมายความว่าข้อมูลจะถูกจัดเก็บไว้ในแต่ละคอลัมน์ และจัดทำดัชนีด้วยคีย์แถวที่ไม่ซ้ำกัน สถาปัตยกรรมนี้ช่วยให้สามารถดึงแต่ละแถวและคอลัมน์ได้อย่างรวดเร็ว และสแกนแต่ละคอลัมน์ภายในตารางได้อย่างมีประสิทธิภาพ ทั้งข้อมูลและคำขอจะถูกกระจายไปยังเซิร์ฟเวอร์ทั้งหมดในคลัสเตอร์ HBase เพื่อช่วยให้คุณสามารถสืบค้นผลลัพธ์ในระดับเพตะไบต์ได้ภายในมิลลิวินาที HBase จะถูกใช้อย่างมีประสิทธิภาพสูงสุดในการจัดเก็บข้อมูลที่ไม่ใช่เชิงสัมพันธ์ เข้าถึงได้ผ่านทาง HBase API Apache Phoenix มักจะใช้เป็นเลเยอร์ SQL ที่ด้านบนของ HBase เพื่อช่วยให้คุณสามารถใช้ไวยากรณ์ SQL ที่คุ้นเคยในการแทรก ลบ และสืบค้นข้อมูลที่จัดเก็บไว้ใน HBase

HBase มีประโยชน์อย่างไรบ้าง

ปรับขนาดได้

HBase ได้รับการออกแบบมาเพื่อจัดการการปรับขนาดในทั่วทั้งเซิร์ฟเวอร์หลายพันเครื่อง และจัดการการเข้าถึงข้อมูลระดับเพตะไบต์ ความยืดหยุ่นของ Amazon EC2 และความสามารถในการปรับขนาดของ Amazon S3 ทำให้ HBase สามารถจัดการการเข้าถึงชุดข้อมูลขนาดใหญ่ทางออนไลน์ได้

รวดเร็ว

HBase จัดหาการเข้าถึงการอ่านและเขียนแบบสุ่มที่มีเวลาแฝงต่ำให้กับข้อมูลระดับเพตะไบต์โดยการกระจายคำขอจากแอปพลิเคชันทั่วทั้งคลัสเตอร์ของโฮสต์ โฮสต์แต่ละรายการสามารถเข้าถึงข้อมูลใน HDFS และ S3 รวมทั้งให้บริการคำขออ่านและเขียนในมิลลิวินาที

ทนต่อความผิดพลาด

HBase จะแบ่งข้อมูลที่จัดเก็บไว้ในตารางทั่วทั้งโฮสต์หลายรายการในคลัสเตอร์ และสร้างขึ้นเพื่อให้ทนต่อความล้มเหลวของโฮสต์แต่ละรายการ เนื่องจากข้อมูลถูกจัดเก็บไว้ใน HDFS หรือ S3 โฮสต์ที่มีสภาพดีจึงถูกเลือกโดยอัตโนมัติให้โฮสต์ข้อมูลที่โฮสต์ที่ล้มเหลวเคยให้บริการ และระบบจะนำข้อมูลไปแสดงทางออนไลน์โดยอัตโนมัติ

กรณีการใช้งานสำหรับ Hbase มีอะไรบ้าง

FINRA ซึ่งเป็นองค์กรควบคุมอุตสาหกรรมการเงิน เป็นหน่วยงานกำกับดูแลหลักทรัพย์อิสระที่ใหญ่ที่สุดในสหรัฐอเมริกา ทำหน้าที่ตรวจติดตามและควบคุมแนวทางปฏิบัติด้านการค้าในแง่ของการเงิน FINRA ใช้ Amazon EMR เพื่อเรียกใช้ Apache HBase บน Amazon S3 เพื่อการเข้าถึงแบบสุ่มไปยังบันทึก 3 ล้านล้านรายการ (เพิ่มขึ้นเป็นพันล้านรายการต่อวัน) สำหรับแอปพลิเคชันแบบอินเทอร์แอคทีฟเพื่อค้นหาและแสดงเหตุการณ์ตลาดที่เกี่ยวข้อง การแยกพื้นที่จัดเก็บและการคำนวณ ทำให้ FINRA สามารถจัดเก็บข้อมูลสำเนาเดียวไว้ใน Amazon S3 และปรับขนาดคลัสเตอร์ตามความจุในการคำนวณที่ต้องการ แทนที่จะปรับขนาดคลัสเตอร์สำหรับการจัดเก็บข้อมูลไว้ใน HDFS ที่มีการจำลองแบบ 3 เท่า ซึ่งช่วยประหยัดค่าใช้จ่ายมากกว่า 60% ต่อปี ความสามารถในการคำนวณที่ปรับขนาดได้ง่าย และลดเวลาในการฟื้นฟูคลัสเตอร์ในโซนความพร้อมใช้งาน EC2 ใหม่จากหลายวันเป็นเวลาน้อยกว่า 30 นาที

Monster ซึ่งเป็นผู้นำระดับโลกในการเชื่อมต่อผู้คนและงาน ใช้ Apache HBase บน Amazon EMR เพื่อจัดเก็บข้อมูลการคลิกสตรีมและแคมเปญโฆษณาเพื่อการวิเคราะห์ดาวน์สตรีม ซึ่งจะช่วยให้พวกเขาสามารถตรวจติดตามได้ว่ากลุ่มลูกค้าต่าง ๆ ดำเนินการอย่างไรในแคมเปญที่กำหนดในระดับความละเอียดของเทคนิคการพิมพ์ครั้งเดียว ทีมวิเคราะห์ของ Monster สามารถสแกนตลอดแถวได้อย่างง่ายดายเพื่อรวมจำนวนการดูและการคลิกต่อผู้ใช้ในการระบุกิจกรรมแคมเปญ นอกจากนี้ ทีมยังใช้การผสานรวมอย่างเข้มงวดของ Apache HBase กับระบบนิเวศ Apache Hadoop อีกด้วย Monster เรียกใช้ Apache Hive บนคลัสเตอร์ Amazon EMR ที่แยกต่างหากเพื่อสืบค้นตาราง HBase ด้วย SQL ซึ่งมีประโยชน์สำหรับการวิเคราะห์เพิ่มเติมและการส่งออกข้อมูลจาก Apache HBase ไปยัง Amazon Redshift  

AWS จะรองรับ HBase และ Hadoop ได้อย่างไร

Amazon EMR มีเฟรมเวิร์ก Hadoop ที่ได้รับการจัดการซึ่งใช้งานง่ายที่สุด เร็วที่สุด และคุ้มค่าที่สุด เพื่อช่วยให้ลูกค้าสามารถประมวลผลข้อมูลปริมาณมหาศาลในทั่วทั้งอินสแตนซ์ EC2 ที่ปรับขนาดได้แบบไดนามิก นอกจากนี้ลูกค้ายังสามารถเรียกใช้เฟรมเวิร์กแบบกระจายตัวยอดนิยมอื่น ๆ ได้ด้วย อาทิเช่น Apache HBase, Hive, Spark, Presto และ Flink ใน EMR 

เรียนรู้เพิ่มเติมเกี่ยวกับ Amazon EMR

เริ่มต้นใช้ Apache HBase บน AWS โดยการสร้างบัญชี AWS ฟรีวันนี้

ขั้นตอนต่อไปบน AWS

ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที

ลงชื่อสมัครใช้งาน 
เริ่มต้นการสร้างในคอนโซล

เริ่มต้นสร้างในคอนโซลการจัดการของ AWS

ลงชื่อเข้าใช้