การแบ่งกลุ่มฐานข้อมูลคืออะไร
การแบ่งกลุ่มฐานข้อมูล คือกระบวนการของการจัดเก็บฐานข้อมูลขนาดใหญ่ในหลายเครื่อง เครื่องหรือเซิร์ฟเวอร์ฐานข้อมูลเดียวสามารถจัดเก็บและประมวลผลได้เพียงจำนวนข้อมูลที่จำกัด การแบ่งกลุ่มฐานข้อมูลเอาชนะข้อจำกัดนี้โดยการแบ่งข้อมูลออกเป็นชิ้นเล็กๆ ที่เรียกว่าส่วนข้อมูล และจัดเก็บส่วนข้อมูลเหล่านั้นไว้ในหลายเซิร์ฟเวอร์ฐานข้อมูล เซิร์ฟเวอร์ฐานข้อมูลทั้งหมดมักจะมีเทคโนโลยีพื้นฐานเดียวกันและทั้งหมดทำงานร่วมกันเพื่อจัดเก็บและประมวลผลข้อมูลปริมาณมาก
เหตุใดการแบ่งส่วนฐานะข้อมูลจึงสำคัญ
เมื่อแอปพลิเคชันเติบโตขึ้น จำนวนผู้ใช้แอปพลิเคชันและจำนวนข้อมูลที่จัดเก็บจะเพิ่มขึ้นเมื่อเวลาผ่านไป ฐานข้อมูลจะกลายเป็นคอขวดถ้าปริมาณข้อมูลมีขนาดใหญ่เกินไปและมีผู้ใช้จำนวนมากพยายามที่จะใช้แอปพลิเคชันในการอ่านหรือบันทึกข้อมูลพร้อมกัน แอปพลิเคชันช้าลงและมีผลต่อประสบการณ์ของลูกค้า การแบ่งส่วนฐานข้อมูลเป็นหนึ่งในวิธีการในการแก้ปัญหานี้เพราะทำให้เกิดการประมวลผลชุดข้อมูลขนาดเล็กในแต่ละส่วนข้อมูล
การแบ่งส่วนฐานข้อมูลมีประโยชน์อย่างไร
องค์กรใช้การแบ่งส่วนฐานข้อมูลเพื่อประโยชน์ต่อไปนี้:
ลดเวลาตอบกลับ
การดึงข้อมูลใช้เวลานานสำหรับฐานข้อมูลขนาดใหญ่ ระบบการจัดการฐานข้อมูล จำเป็นต้องค้นหาหลายแถวเพื่อดึงข้อมูลที่ถูกต้อง ในทางตรงกันข้าม ส่วนข้อมูลนั้นมีแถวน้อยกว่าฐานข้อมูลทั้งหมด ดังนั้นจึงใช้เวลาน้อยลงในการดึงข้อมูลที่ต้องการหรือเรียกใช้รันคิวรี่ฐานข้อมูลที่แบ่งส่วนแล้ว
หลีกเลี่ยงปัญหาการหยุดชะงักของบริการทั้งหมด
ถ้าคอมพิวเตอร์ที่เป็นโฮสต์ฐานข้อมูลล้มเหลว แอปพลิเคชันที่ขึ้นอยู่กับฐานข้อมูลนั้นก็จะล้มเหลวเช่นกัน การแบ่งส่วนฐานข้อมูลป้องกันปัญหานี้โดยการกระจายส่วนของฐานข้อมูลลงในคอมพิวเตอร์ต่างๆ ความล้มเหลวของคอมพิวเตอร์เครื่องใดเครื่องหนึ่งจะไม่ชัตดาวน์แอปพลิเคชันเนื่องจากยังสามารถทำงานกับส่วนข้อมูลอื่นๆ ได้ โดยยังมักจะทำการแบ่งส่วนข้อมูลร่วมกับการจำลองข้อมูลข้ามส่วนข้อมูลด้วย ดังนั้น ถ้าหนึ่งส่วนข้อมูลใช้การไม่ได้ จะยังคงสามารถเข้าถึงข้อมูลและกู้คืนจากส่วนข้อมูลสำรองได้
ปรับขนาดได้อย่างมีประสิทธิภาพ
ฐานข้อมูลที่เติบโตขึ้นใช้ทรัพยากรการประมวลผลมากขึ้นและบรรลุขีดความจุสูงสุด องค์กรสามารถใช้การแบ่งส่วนฐานข้อมูลเพื่อเพิ่มทรัพยากรการประมวลผลมากขึ้นเพื่อรองรับการปรับฐานข้อมูล พวกเขาสามารถเพิ่มส่วนข้อมูลใหม่ที่รันไทม์ได้โดยไม่ต้องปิดแอปพลิเคชันสำหรับการบำรุงรักษา
การแบ่งส่วนฐานข้อมูลทำงานอย่างไร
ฐานข้อมูลเก็บข้อมูลในชุดข้อมูลหลายส่วนที่ประกอบด้วยคอลัมน์และแถว การแบ่งส่วนฐานข้อมูลจะแยกชุดข้อมูลหนึ่งชุดลงในพาร์ทิชันหรือส่วนข้อมูล แต่ละส่วนข้อมูลจะมีแถวที่ไม่ซ้ำกันของข้อมูลที่คุณสามารถจัดเก็บแยกต่างหากในคอมพิวเตอร์หลายเครื่องได้ หรือที่เรียกว่าโหนด ส่วนข้อมูลทั้งหมดทำงานบนโหนดต่างกัน แต่ใช้สคีมาหรือรูปแบบฐานข้อมูลเดิม
ยกตัวอย่างเช่น ฐานข้อมูลที่ไม่ได้แบ่งส่วนที่มีชุดข้อมูลสำหรับระเบียนลูกค้าอาจมีลักษณะเช่นนี้
รหัสลูกค้า |
ชื่อ |
รัฐ |
1 |
จอห์น |
แคลิฟอร์เนียเหนือ |
2 |
เจน |
วอชิงตัน |
3 |
เปาโล |
แอริโซนา |
4 |
แวง |
จอร์เจีย |
การแบ่งส่วนข้อมูลนั้นยังรวมถึงการแบ่งแถวของข้อมูลจากตาราง และจัดเก็บไว้ในเครื่องต่างๆ ดังต่อไปนี้
คอมพิวเตอร์ A
รหัสลูกค้า |
ชื่อ |
รัฐ |
1 |
จอห์น |
แคลิฟอร์เนียเหนือ |
2 |
เจน |
วอชิงตัน |
คอมพิวเตอร์ B
รหัสลูกค้า |
ชื่อ |
รัฐ |
3 |
เปาโล |
แอริโซนา |
4 |
แวง |
จอร์เจีย |
Shard
ชุดข้อมูลที่แบ่งเป็นพาร์ทิชันไว้นั้นเรียกว่าส่วนข้อมูลโลจิคัล เครื่องที่เก็บส่วนข้อมูลโลจิคัลนั้นเรียกว่าส่วนข้อมูลกายภาพหรือโหนดฐานข้อมูล ส่วนข้อมูลทางกายภาพประกอบไปด้วยส่วนข้อมูลโลจิคัลมากมาย
คีย์ของส่วนข้อมูล
นักพัฒนาซอฟต์แวร์ใช้คีย์ของส่วนข้อมูลในการกำหนดวิธีการแบ่งพาร์ทิชันชุดข้อมูล คอลัมน์ในชุดข้อมูลจะกำหนดว่าแถวข้อมูลใดจะถูกรวมเข้าด้วยกันเป็นส่วนข้อมูล นักออกแบบฐานข้อมูลเลือกคีย์ส่วนข้อมูลจากคอลัมน์ที่มีอยู่หรือสร้างใหม่
สถาปัตยกรรมที่ไม่ใช้ร่วมกัน
การแบ่งส่วนฐานข้อมูลทำงานบนสถาปัตยกรรมที่ไม่ใช้ร่วมกัน ส่วนข้อมูลกายภาพแต่ละชิ้นทำงานได้อย่างอิสระและไม่สัมพันธ์กับส่วนข้อมูลอื่นๆ มีเพียงส่วนข้อมูลกายภาพที่มีข้อมูลที่คุณร้องขอเท่านั้นที่จะประมวลผลในแบบคู่ขนานให้กับคุณ
เลเยอร์ซอฟต์แวร์จะประสานกับพื้นที่เก็บข้อมูลและเข้าถึงจากส่วนข้อมูลแยกย่อยเหล่านี้ ยกตัวอย่างเช่น เทคโนโลยีฐานข้อมูลบางประเภทมีฟีเจอร์แบ่งส่วนข้อมูลอัตโนมัติในตัว นักพัฒนาซอฟต์แวร์ยังสามารถเขียนโค้ดแบ่งส่วนข้อมูลในแอปพลิเคชันของพวกเขาเพื่อจัดเก็บหรือดึงข้อมูลจากส่วนข้อมูลที่ถูกต้องหรือหลายๆ ส่วนได้
การแบ่งส่วนฐานข้อมูลมีกี่ประเภท
วิธีการแบ่งส่วนฐานข้อมูลใช้กฎที่แตกต่างกันกับคีย์ส่วนข้อมูลเพื่อระบุโหนดที่ถูกต้องสำหรับแถวข้อมูลนั้นๆ ต่อไปนี้คือสถาปัตยกรรมการแบ่งส่วนข้อมูลทั่วไป
การแบ่งส่วนข้อมูลตามช่วง
การแบ่งส่วนข้อมูลตามช่วงหรือการแบ่งส่วนข้อมูลแบบไดนามิกจะแบ่งแถวฐานข้อมูลตามช่วงของค่า จากนั้นนักออกแบบฐานข้อมูลจะกำหนดคีย์ส่วนข้อมูลให้กับช่วงนั้นๆ ยกตัวอย่างเช่น นักออกแบบฐานข้อมูลจะแบ่งพาร์ทิชันข้อมูลตามพยัญชนะตัวแรกของชื่อของลูกค้า ดังต่อไปนี้
ชื่อ |
คีย์ของส่วนข้อมูล |
เริ่มต้นด้วย A ถึง I |
ก. |
เริ่มต้นด้วย J ถึง S |
ข. |
เริ่มต้นด้วย T ถึง Z |
ค. |
เมื่อมีการเขียนบันทึกลูกค้าไปยังฐานข้อมูล แอปพลิเคชันจะระบุคีย์ของส่วนข้อมูลที่ถูกต้องโดยการตรวจสอบชื่อของลูกค้า จากนั้นแอปพลิเคชันจะจับคู่คีย์กับโหนดกายภาพและจัดเก็บแถวไปยังเครื่องดังกล่าว ในทำนองเดียวกัน แอปพลิเคชันจะทำการจับคู่ย้อนกลับเมื่อค้นหาบันทึกใดโดยเฉพาะ
ข้อดีและข้อเสีย
ขึ้นอยู่กับค่าข้อมูล การแบ่งส่วนตามช่วงสามารถทำให้เกิดข้อมูลเกินพิกัดในโหนดกายภาพเดียวได้ ในตัวอย่างของเรา ส่วนข้อมูล (ที่มีชื่อที่ขึ้นต้นด้วย A ถึง I) อาจจะมีจำนวนมากกว่าส่วนข้อมูล C มาก (ที่มีชื่อที่ขึ้นต้นด้วย T ถึง Z) แต่อย่างไรก็ตาม การนำไปใช้จริงนั้นก็ง่ายกว่า
ส่วนข้อมูลแบบแฮช
ส่วนข้อมูลแบบแฮชจะกำหนดคีย์ส่วนข้อมูลให้กับแต่ละแถวของฐานข้อมูล โดยใช้สูตรทางคณิตศาสตร์ที่เรียกว่าฟังก์ชั่นแฮช ฟังก์ชั่นแฮชจะนำข้อมูลจากแถวนั้นมาละสร้างเป็นค่าแฮช แอปพลิเคชันจะใช้ค่าแฮชเป็นคีย์ส่วนข้อมูลและจัดเก็บข้อมูลไว้ในส่วนข้อมูลกายภาพนั้นๆ
นักพัฒนาซอฟต์แวร์ใช้ส่วนข้อมูลแบบแฮชเพื่อกระจายข้อมูลในฐานข้อมูลในหมู่ส่วนข้อมูลต่างๆ ยกตัวอย่างเช่น ซอฟต์แวร์แยกระเบียนของลูกค้าออกเป็นสองส่วนข้อมูลที่มีค่าแฮชเท่ากับ 1 และ 2
ชื่อ |
ค่าแฮช |
จอห์น |
1 |
เจน |
2 |
เปาโล |
1 |
แวง |
2 |
ข้อดีและข้อเสีย
แม้ว่าการแบ่งส่วนข้อมูลแบบแฮชจะทำให้กระจายข้อมูลได้ทั่วถึงกันในส่วนข้อมูลกายภาพ แต่ก็ไม่ได้แยกฐานข้อมูลตามความหมายของข้อมูล ดังนั้น นักพัฒนาซอฟต์แวร์อาจประสบปัญหาการกำหนดค่าแฮชเมื่อเพิ่มส่วนข้อมูลกายภาพไปยังสภาพแวดล้อมการประมวลผลมากขึ้น
ส่วนข้อมูลไดเรกทอรี
ส่วนข้อมูลไดเรกทอรีใช้ตารางการค้นหาในการจับคู่ข้อมูลในฐานข้อมูลเข้ากับส่วนข้อมูลกายภาพที่เกี่ยวข้องกัน ตารางการค้นหาเป็นเหมือนตารางบนสเปรดชีตที่เชื่อมโยงคอลัมน์ฐานข้อมูลกับคีย์ส่วนข้อมูล ตัวอย่างเช่น แผนภาพต่อไปนี้แสดงตารางการค้นหาสำหรับสีเสื้อผ้า
สี |
คีย์ของส่วนข้อมูล |
สีน้ำเงิน |
ก. |
สีแดง |
ข. |
สีเหลือง |
ค. |
สีดำ |
ง. |
เมื่อแอปพลิเคชันเก็บข้อมูลเสื้อผ้าในฐานข้อมูล แอปพลิเคชันนั้นจะอ้างอิงจากตารางการค้นหา ถ้าชุดเป็นสีฟ้า แอปพลิเคชันจะจัดเก็บข้อมูลไว้ในส่วนข้อมูลที่ตรงกัน
ข้อดีและข้อเสีย
นักพัฒนาซอฟต์แวร์ใช้ส่วนข้อมูลไดเรกทอรีเพราะมีความยืดหยุ่น แต่ละส่วนข้อมูลเป็นตัวแทนความหมายของฐานข้อมูลและไม่ได้จำกัดโดยช่วง อย่างไรก็ตาม ส่วนข้อมูลไดเรกทอรีจะล้มเหลวถ้าตารางการค้นหาประกอบด้วยข้อมูลที่ไม่ถูกต้อง
ส่วนข้อมูลภูมิศาสตร์
ส่วนข้อมูลภูมิศาสตร์จะแยกและเก็บข้อมูลฐานข้อมูลตามตำแหน่งทางภูมิศาสตร์ ยกตัวอย่างเช่น เว็บไซต์บริการหาคู่ ใช้ฐานข้อมูลเพื่อเก็บข้อมูลลูกค้าจากเมืองต่างๆ ดังนี้
ชื่อ |
คีย์ของส่วนข้อมูล |
จอห์น |
แคลิฟอร์เนียเหนือ |
เจน |
วอชิงตัน |
เปาโล |
แอริโซนา |
นักพัฒนาซอฟต์แวร์ใช้เมืองเป็นคีย์ส่วนข้อมูล โดยจะเก็บข้อมูลของลูกค้าแต่ละรายในส่วนข้อมูลกายภาพที่อยู่ทางภูมิศาสตร์ในเมืองที่เกี่ยวข้อง
ข้อดีและข้อเสีย
ส่วนข้อมูลภูมิศาสตร์ช่วยให้แอปพลิเคชันสามารถเรียกข้อมูลได้เร็วขึ้นเนื่องจากระยะห่างระหว่างส่วนข้อมูลและลูกค้าที่ร้องขอ ถ้ารูปแบบการเข้าถึงข้อมูลส่วนใหญ่ขึ้นอยู่กับภูมิศาสตร์แล้ว วิธีนี้เป็นวิธีที่เหมาะสม แต่อย่างไรก็ตาม ส่วนข้อมูลทางภูมิศาสตร์ก็อาจส่งผลให้มีการกระจายข้อมูลที่ไม่สม่ำเสมอ
วิธีการเพิ่มประสิทธิภาพการแบ่งส่วนฐานข้อมูลสำหรับการกระจายข้อมูลอย่างเท่าเทียมกัน
เมื่อส่วนข้อมูลกายภาพใดนั้นมีข้อมูลเกินพิกัด แม้ว่าส่วนอื่นๆ จะยังไม่เกินพิกัด อาจส่งผลให้เกิดพื้นที่ที่มีการใช้งานสูงในฐานข้อมูลได้ พื้นที่ที่มีการใช้งานสูงจะชะลอกระบวนการดึงข้อมูลบนฐานข้อมูล และทำลายวัตถุประสงค์ของการแบ่งส่วนข้อมูล
การเลือกคีย์ส่วนข้อมูลที่ดีจะสามารถกระจายข้อมูลไปไว้ในส่วนข้อมูลต่างๆ ได้ดี เมื่อเลือกคีย์ส่วนข้อมูล นักออกแบบฐานข้อมูลควรพิจารณาปัจจัยดังต่อไปนี้
คาร์ดินัลลิตี้
คาร์ดินาลลิตี้จะอธิบายค่าที่เป็นไปได้ของคีย์ส่วนข้อมูล โดยจะเป็นตัวกำหนดจำนวนสูงสุดที่เป็นไปได้ของส่วนข้อมูลในฐานข้อมูลที่จัดการเป็นคอลัมน์แบบแยก ตัวอย่างเช่นหากผู้ออกแบบฐานข้อมูลเลือกช่องข้อมูลแบบใช่/ไม่เป็นคีย์ส่วนข้อมูล จำนวนของคีย์ก็จะจำกัดอยู่ที่สอง
ความถี่
ความถี่คือความน่าจะเป็นของการจัดเก็บข้อมูลที่เฉพาะเจาะจงในส่วนข้อมูลนั้นๆ ยกตัวอย่างเช่น การออกแบบฐานข้อมูลเลือกอายุเป็นคีย์ส่วนข้อมูลสำหรับเว็บไซต์ฟิตเนส บันทึกส่วนใหญ่อาจจะไปลงในโหนดสำหรับสมาชิกอายุ 30-45 ปีและส่งผลให้เกิดพื้นที่ที่มีการใช้งานสูงในฐานข้อมูล
การเปลี่ยนแปลงโมโนโทนิค
การเปลี่ยนแปลงแบบโมโนโทนิคคืออัตราการเปลี่ยนแปลงของคีย์ส่วนข้อมูล การเพิ่มขึ้นหรือลดลงแบบโมโนโทนิคทำให้เกิดส่วนข้อมูลที่ไม่สมดุล ยกตัวอย่างเช่น ฐานข้อมูลของผลตอบรับจะแบ่งออกเป็นสามส่วนข้อมูลกายภาพต่อไปนี้:
- ส่วนข้อมูล A เก็บข้อเสนอแนะจากลูกค้าที่ซื้อสินค้า 0 - 10 รายการ
- ส่วนข้อมูล B เก็บข้อเสนอแนะจากลูกค้าที่ซื้อสินค้า 11 - 20 รายการ
- ส่วนข้อมูล C เก็บข้อเสนอแนะจากลูกค้าที่ซื้อสินค้า 21 รายการหรือมากกว่า
เมื่อธุรกิจเติบโตขึ้นลูกค้าจะซื้อสินค้าได้มากกว่า 21 รายการขึ้นไป แอปพลิเคชันเก็บข้อเสนอแนะของพวกเขาไว้ในส่วนข้อมูล C ซึ่งส่งผลให้ส่วนข้อมูลไม่สมดุลเพราะส่วนข้อมูล C มีบันทึกข้อเสนอแนะมากขึ้นกว่าส่วนข้อมูลอื่นๆ
อะไรคือทางเลือกอื่นนอกจากการแบ่งส่วนฐานข้อมูล
การแบ่งส่วนฐานข้อมูลเป็นกลยุทธ์การปรับขนาดแนวนอนที่จัดสรรโหนดหรือคอมพิวเตอร์ที่จะแบ่งปันเวิร์กโหลดของแอปพลิเคชันเพิ่มเติม องค์กรได้รับประโยชน์จากการปรับขนาดแนวนอนเพราะเป็นสถาปัตยกรรมทที่มีข้อผิดพลาดน้อย เมื่อคอมพิวเตอร์เครื่องหนึ่งหยุดทำงาน เครื่องอื่น จะยังคงทำงานโดยไม่หยุดชะงัก นักออกแบบฐานข้อมูลจะเวลาดาวน์ไท์ได้โดยการกระจายส่วนข้อมูลกายภาพไว้ในเซิร์ฟเวอร์หลายเครื่อง
อย่างไรก็ตาม ส่วนข้อมูลเป็นเพียงหนึ่งในกลยุทธ์การปรับขนาดฐานข้อมูลมากมาย เรียนรู้เทคนิคอื่นๆ และเข้าใจความแตกต่าง
การปรับขนาดแนวตั้ง
การปรับขนาดแนวตั้งเพิ่มพลังการประมวลผลของเครื่องเครื่องเดียว ตัวอย่างเช่น ทีมไอทีจะเพิ่ม CPU, RAM และฮาร์ดดิสก์ไปยังเซิร์ฟเวอร์ฐานข้อมูลเพื่อเพิ่มปริมาณการใช้งานที่เพิ่มขึ้น
การเปรียบเทียบการเข้ารหัสฐานข้อมูลและการปรับขนาดแนวตั้ง
การปรับขนาดแนวตั้งมีค่าใช้จ่ายน้อย แต่มีข้อจำกัดในการใช้ทรัพยากรประมวลผลที่ไม่สามารถปรับขนาดแนวตั้งได้ แต่อีกด้านหนึ่ง การแบ่งส่วนข้อมูลซึ่งเป็นกลยุทธ์การปรับขนาดแนวนอนจะง่ายต่อการนำไปใช้จริงมากกว่า ตัวอย่างเช่น ทีม IT ติดตั้งคอมพิวเตอร์หลายเครื่องแทนการปรับรุ่นฮาร์ดแวร์คอมพิวเตอร์เก่า
การจำลองแบบ
การจำลองแบบเป็นเทคนิคที่สร้างสำเนาที่แน่นอนของฐานข้อมูลและเก็บไว้ในคอมพิวเตอร์หลายเครื่อง นักออกแบบฐานข้อมูลใช้การจำลองแบบในการออกแบบ ระบบการจัดการฐานข้อมูลแบบเชิงสัมพันธ์ที่มีความผิดพลาดต่ำ เมื่อหนึ่งในคอมพิวเตอร์ที่โฮสต์ฐานข้อมูลหยุดทำงาน แบบจำลองอื่นๆ จะยังคงทำงานอยู่ การจำลองแบบเป็นแนวทางปฏิบัติทั่วไปในระบบคอมพิวเตอร์แบบกระจาย
การเปรียบเทียบการแบ่งส่วนฐานข้อมูลและการจำลองแบบ
การแบ่งส่วนฐานข้อมูลไม่ได้สร้างสำเนาของข้อมูลเดียวกัน แต่เป็นการแยกฐานข้อมูลหนึ่งออกเป็นหลายส่วนและเก็บไว้ในคอมพิวเตอร์หลายเครื่อง ซึ่งแตกต่างจากการจำลองแบบ การแบ่งส่วนฐานข้อมูลไม่ได้ทำให้เกิดความพร้อมใช้งานสูง การแบ่งส่วนข้อมูลสามารถใช้ร่วมกับการจำลองแบบเพื่อให้ได้ทั้งขนาดและความพร้อมใช้งานสูงได้
ในบางกรณี การแบ่งส่วนฐานข้อมูลอาจประกอบด้วยการจำลองแบบของชุดข้อมูลใดข้อมูลหนึ่ง ยกตัวอย่างเช่น ร้านค้าปลีกที่ขายสินค้าให้กับลูกค้าทั้งสหรัฐอเมริกาและยุโรปอาจเก็บแบบจำลองของตารางการแปลงขนาดบนส่วนข้อมูลคนละส่วนสำหรับทั้งสองภูมิภาค แอปพลิเคชันสามารถใช้สำเนาที่คัดลอกไว้ของตารางการแปลงเพื่อแปลงขนาดได้โดยไม่ต้องเข้าถึงเซิร์ฟเวอร์ฐานข้อมูลอื่นๆ
การแบ่งพาร์ทิชัน
พาร์ทิชันเป็นกระบวนการของการแยกตารางฐานข้อมูลออกเป็นหลายกลุ่ม โดยแบ่งออกได้เป็น 2 ประเภท คือ
- การแบ่งพาร์ทิชันแนวนอนที่แยกฐานข้อมูลเป็นแถว
- การแบ่งพาร์ทิชันแนวตั้งที่สร้างพาร์ทิชันต่างๆ ของคอลัมน์ฐานข้อมูล
เปรียบเทียบการแบ่งส่วนฐานข้อมูลและการแบ่งพาร์ทิชัน
การแบ่งส่วนฐานข้อมูลเป็นเหมือนการแบ่งพาร์ทิชันแนวนอน ทั้งสองกระบวนการแยกฐานข้อมูลออกเป็นกลุ่มแถวที่ไม่ซ้ำกันหลายกลุ่ม การแบ่งพาร์ทิชันจะเก็บกลุ่มข้อมูลทั้งหมดในคอมพิวเตอร์เครื่องเดียวกัน แต่การแบ่งส่วนฐานข้อมูลกระจายไปทั่วคอมพิวเตอร์หลากหลายเครื่อง
ปัญหาของการแบ่งส่วนฐานข้อมูลคืออะไร
องค์กรอาจต้องเผชิญกับปัญหาเหล่านี้เมื่อมีการแบ่งส่วนข้อมูลฐานข้อมูล
พื้นที่ที่มีการใช้งานข้อมูลสูง
ส่วนข้อมูลส่วนกลายเป็นไม่สมดุลเนื่องจากการกระจายข้อมูลที่ไม่สม่ำเสมอ ยกตัวอย่างเช่น ส่วนข้อมูลกายภาพเดียวที่มีชื่อลูกค้าที่ขึ้นต้นด้วย A ได้รับข้อมูลมากกว่าส่วนอื่นๆ ส่วนข้อมูลทางกายภาพนี้จะใช้ทรัพยากรการประมวลผลมากกว่าส่วนอื่นๆ
โซลูชัน
คุณสามารถกระจายข้อมูลอย่างเท่าเทียมกันโดยใช้คีย์ส่วนข้อมูลที่เหมาะสม ชุดข้อมูลบางชุดเหมาะสมสำหรับการทำส่วนข้อมูลมากกว่าชุดข้อมูลอื่นๆ
ความซับซ้อนในการดำเนินงาน
การแบ่งส่วนข้อมูลฐานข้อมูลสร้างความซับซ้อนในการดำเนินงาน แทนที่จะจัดการฐานข้อมูลเดียว นักพัฒนาต้องจัดการโหนดฐานข้อมูลหลายโหนด เมื่อกำลังเรียกข้อมูล นักพัฒนาจะต้องคิวรี่ส่วนข้อมูลหลายส่วนและรวมข้อมูลเข้าด้วยกัน การดำเนินการดึงข้อมูลเหล่านี้สามารถทำให้การวิเคราะห์มีความซับซ้อนได้
โซลูชัน
ใน พอร์ตโฟลิโอฐานข้อมูลของ AWS การตั้งค่าฐานข้อมูลและการดำเนินงานนั้นเป็นกระบวนการอัตโนมัติส่วนมาก ซึ่งทำให้การทำงานกับสถาปัตยกรรมฐานข้อมูลที่แบ่งเป็นส่วนข้อมูลนั้นคล่องตัวมากขึ้น
ค่าใช้จ่ายโครงสร้างพื้นฐาน
องค์กรต้องจ่ายค่าใช้จ่ายด้านโครงสร้างพื้นฐานมากขึ้นเมื่อเพิ่มคอมพิวเตอร์ไปยังส่วนข้อมูลกายภาพ ค่าใช้จ่ายในการบำรุงรักษาอาจเพิ่มขึ้นหากคุณเพิ่มจำนวนเครื่องในศูนย์ข้อมูลในองค์กร
โซลูชัน
นักพัฒนาซอฟต์แวร์ใช้ Amazon Elastic Compute Cloud (Amazon EC2) เพื่อโฮสต์และปรับขนาดส่วนข้อมูลบนคลาวด์ คุณสามารถประหยัดเงินโดยใช้โครงสร้างพื้นฐานเสมือนที่ AWS จัดการได้อย่างเต็มที่
ความซับซ้อนของแอปพลิเคชัน
ระบบการจัดการฐานข้อมูลส่วนใหญ่ไม่มีคุณสมบัติแบ่งส่วนข้อมูลในตัว ซึ่งหมายความว่านักออกแบบฐานข้อมูลและนักพัฒนาซอฟต์แวร์จะต้องแยกและจัดการฐานข้อมูลด้วยตนเอง
โซลูชัน
คุณสามารถโยกย้ายข้อมูลของคุณไปยัง ฐานข้อมูลที่สร้างตามวัตถุประสงค์ของ AWS ซึ่งมีคุณสมบัติในตัวหลายอย่างที่สนับสนุนการปรับขนาดแนวนอน
AWS ช่วยเหลือคุณในการแบ่งส่วนข้อมูลได้อย่างไร
AWS เป็น แพลตฟอร์มการจัดการข้อมูลระดับโลกที่คุณสามารถใช้เพื่อสร้างกลยุทธ์ข้อมูลที่ทันสมัย ด้วย AWS คุณสามารถเลือกฐานข้อมูลที่สร้างตามวัตถุประสงค์ ที่เหมาะสม บรรลุประสิทธิภาพในระดับที่เหมาะสม เรียกใช้ฐานข้อมูลที่มีการจัดการอย่างเต็มรูปแบบ และมีความพร้อมใช้งานและความปลอดภัยสูง
เริ่มต้นการบริหารจัดการข้อมูลบน AWS ด้วยการสร้างบัญชี AWS วันนี้