ما المقصود بمستودع البيانات؟
مستودع البيانات هو مستودع مركزي يضم المعلومات التي يمكن تحليلها لاتخاذ قرارات أكثر استنارةً. تتدفق البيانات إلى مستودع بيانات من أنظمة المعاملات وقواعد البيانات العلائقية والمصادر الأخرى، وعادةً يكون التدفق بإيقاع منتظم. يصل محللو الأعمال ومهندسو البيانات وعلماء البيانات وصناع القرار إلى البيانات من خلال أدوات ذكاء الأعمال (BI) وعملاء SQL وتطبيقات التحليلات الأخرى.
أصبحت البيانات والتحليلات لا غنى عنها للشركات للحفاظ على قدرتها التنافسية. يعتمد مستخدمو الأعمال على التقارير ولوحات المعلومات وأدوات التحليلات لاستخراج الأفكار من بياناتهم ومراقبة أداء الأعمال ودعم عملية صنع القرار. تعمل مستودعات البيانات على تشغيل هذه التقارير ولوحات المعلومات وأدوات التحليلات من خلال تخزين البيانات بكفاءة لتقليل المدخلات والمخرجات (I/O) للبيانات وتقديم نتائج الاستعلام بسرعة إلى مئات وآلاف المستخدمين في نفس الوقت.
كيف صُممت هيكلة مستودع البيانات؟
تتألف هيكلة مستودع البيانات من طبقات. الطبقة العليا هي عميل الواجهة الأمامية الذي يقدم النتائج من خلال أدوات إنشاء التقارير والتحليل والتنقيب في البيانات. تتكون الطبقة الوسطى من محرك التحليلات الذي يُستخدم في الوصول إلى البيانات وتحليلها. الطبقة السفلى من البنية هي خادم قاعدة البيانات الذي يُجرى تحميل البيانات منه وتخزينها فيه. تُخزن البيانات بنوعين مختلفين من الطرق: 1) تُخزن البيانات التي يتم الوصول إليها بشكل متكرر في مخزن سريع للغاية (مثل محركات أقراص SSD)، و2) تُخزن البيانات التي يتم الوصول إليها بشكل غير منتظم في مخزن كائنات تكلفته بسيطة، مثل Amazon S3. سيتأكد مستودع البيانات تلقائيًا من نقل البيانات التي يتم الوصول إليها بشكل متكرر إلى المخزن "السريع" من أجل تحسين سرعة الاستعلامات.
كيف يعمل مستودع البيانات؟
يمكن أن يحتوي مستودع البيانات على قواعد بيانات متعددة. وداخل كل قاعدة بيانات، تُنظم البيانات في جداول وأعمدة. وداخل كل عمود، يمكنك تحديد وصف للبيانات، مثل عدد صحيح أو حقل بيانات أو سلسلة. يمكن تنظيم الجداول داخل مخططات، وهي يمكنك اعتبارها مجلدات. عند استيعاب البيانات، تُخزن في جداول مختلفة يصفها المخطط. ومن ثم، تستخدم أدوات الاستعلام هذا المخطط لتحديد أي جداول بيانات يجب الوصول إليها وتحليلها.
ما فوائد استخدام مستودع البيانات؟
تشمل مزايا مستودع البيانات ما يلي:
- اتخاذ قرارات مستنيرة
- بيانات مجمعة من عدة مصادر
- تحليل البيانات التاريخية
- جودة البيانات واتساقها ودقتها
- فصل معالجة التحليلات عن قواعد بيانات المعاملات، ما يحسِّن أداء كلا النظامين
كيف تعمل مستودعات البيانات وقواعد البيانات ومخازن البيانات معًا؟
عادةً ما تستخدم الأعمال مزيجًا من قاعدة البيانات ومخزن البيانات ومستودع البيانات لتخزين البيانات وتحليلها. تسهِّل هيكلة lake house في خدمة Amazon Redshift تحقيق هذا التكامل.
مع زيادة حجم البيانات وتنوعها، من المفيد اتباع واحد أو أكثر من الأنماط الشائعة للعمل على البيانات عبر قاعدة البيانات ومخزن البيانات ومستودع البيانات لديك:
على عكس مستودع البيانات، يُعد مخزن البيانات مستودعًا مركزيًا لجميع البيانات، بما في ذلك البيانات المهيكلة وشبه المهيكلة وغير المهيكلة. يتطلب مستودع البيانات تنظيم البيانات في تنسيق جدولي، حيث يأتي دور المخطط. التنسيق الجدولي مطلوب حتى يمكن استخدام SQL للاستعلام عن البيانات. ولكن لا تتطلب جميع التطبيقات أن تكون البيانات في تنسيق جدولي. يمكن لبعض التطبيقات، مثل تحليلات البيانات الضخمة والبحث في النصوص الكاملة وتعلّم الآلة، الوصول إلى البيانات حتى لو كانت "شبه مهيكلة" أو غير مهيكلة تمامًا.
لإجراء مقارنة متعمقة بين مستودعات البيانات ومخازن البيانات، تفضل بزيارة صفحة المقارنة المخصصة الخاصة بمستودع البيانات مقابل مخزن البيانات.
ما وجه المقارنة بين متجر البيانات ومستودع البيانات؟
يُعد متجر البيانات مستودع بيانات يخدم احتياجات فريق أو وحدة أعمال معينة، مثل الشؤون المالية أو التسويق أو المبيعات. إنه أصغر حجمًا وأكثر تركيزًا، وقد يحتوي على ملخصات للبيانات التي تخدم مجتمع المستخدمين بشكل أفضل. قد يكون متجر البيانات جزءًا من مستودع البيانات أيضًا.
لإجراء مقارنة متعمقة بين متجر البيانات ومستودعات البيانات، تفضل بزيارة صفحة المقارنة المخصصة لمتجر البيانات مقابل مستودع البيانات.
كيف يمكن لـ AWS دعم جهود مستودع البيانات الخاصة بك؟
تتيح لك AWS الاستفادة من جميع المزايا الأساسية المرتبطة بالحوسبة عند الطلب: الوصول إلى سعة تخزين وحوسبة لا حدود لهما على ما يبدو، وتوسيع نطاق نظامك بالتوازي مع الكمية المتزايدة من البيانات المجمعة والمخزنة والمستعلم عنها، وعدم الدفع إلا مقابل الموارد التي تستخدمها. تقدم AWS مجموعة واسعة من الخدمات المُدارة التي تتكامل بسلاسة بعضها مع بعض حتى تتمكن من سرعة نشر حلول التحليلات الشاملة ومستودعات البيانات.
يُظهر الرسم التوضيحي التالي الخطوات الرئيسة لعملية التحليلات الشاملة التي تُسمى أيضًا المكدس. تقدم AWS مجموعة متنوعة من الخدمات المُدارة في كل خطوة.
Amazon Redshift هي خدمة مستودعات بيانات سريعة ومُدارة بالكامل وفعالة من حيث التكلفة. وهي تتيح لك تخزين البيانات في مستودعات بأحجام من البيتابايت وإجراء تحليلات مخزن بيانات بأحجام من الإكسابايت معًا في خدمة واحدة لا تدفع فيها إلا مقابل ما تستخدمه.
ابدأ في استخدام مستودع البيانات على AWS من خلال إنشاء حساب اليوم.