ما المقصود بـ Apache HBase؟

Apache HBase هو مخزن بيانات كبيرة، NoSQL، موزع مفتوح المصدر. وهو يتيح الوصول العشوائي والمتسق تمامًا في الوقت الفعلي إلى وحدات بيتابايت من البيانات. ويعد HBase فعالًا للغاية في التعامل مع مجموعات البيانات الكبيرة والمتفرقة.

يتكامل HBase بسلاسة مع Apache Hadoop ومع نظام Hadoop المتكامل ويعمل على نظام الملفات الموزّعة لـ Hadoop (HDFS) أو Amazon S3 باستخدام نظام الملفات Amazon Elastic MapReduce (EMR) أو EMRFS. يعمل HBase كإدخال مباشر وإخراج مباشر لإطار Apache MapReduce لـ Hadoop، ويعمل مع Apache Phoenix لتمكين الاستعلامات التي تشبه SQL عبر جداول HBase. 

شعار HBase

ما آلية عمل HBase؟

HBase هو قاعدة بيانات غير علائقية موجهة للأعمدة. هذا يعني أنه يتم تخزين البيانات في أعمدة فردية، ويتم فهرستها بواسطة مفتاح صف فريد. تسمح هذه البنية بالاسترداد السريع للصفوف والأعمدة الفردية وعمليات المسح الفعّالة للأعمدة الفردية داخل الجدول. يتم توزيع كل من البيانات والطلبات عبر جميع الخوادم في مجموعة HBase، مما يسمح لك بالاستعلام عن النتائج على وحدات بيتابايت من البيانات في غضون أجزاء من الثانية. يجري استخدام HBase بشكل أكثر فاعلية لتخزين البيانات غير العلائقية، والتي يتم الوصول إليها عبر واجهة برمجة تطبيقات HBase. يُستخدم Apache Phoenix بشكل شائع كطبقة SQL على HBase، مما يسمح لك باستخدام بناء جملة SQL المألوفة لإدراج البيانات المخزنة في HBase وحذفها والاستعلام عنها.

ما مزايا HBase؟

قابلية التكيف

تم تصميم HBase للتعامل مع التوسّع عبر آلاف الخوادم وإدارة الوصول إلى وحدات بيتابايت من البيانات. بفضل مرونة Amazon EC2 وقابلية توسّع Amazon S3، أصبح HBase قادرًا على التعامل مع الوصول عبر الإنترنت إلى مجموعات البيانات الضخمة.

السرعة

يوفر HBase الوصول العشوائي للقراءة والكتابة بزمن استجابة منخفض إلى وحدات بيتابايت من البيانات عن طريق توزيع الطلبات الواردة من التطبيقات عبر مجموعة من المضيفات. يتمتع كل مضيف بإمكانية الوصول إلى البيانات في HDFS وS3، ويخدم طلبات القراءة والكتابة في أجزاء من الثانية.

تحمل الأخطاء

يقسم HBase البيانات المخزنة في الجداول عبر عدة مضيفات في المجموعة وهو مصمم لتحمل حالات تعطل المضيف الفردي. نظرًا لتخزين البيانات على HDFS أو S3، سيتم اختيار المضيفات السليمة تلقائيًا لاستضافة البيانات بمجرد تقديمها من قبل المضيف المتعطل، ويتم جلب البيانات عبر الإنترنت تلقائيًا.

ما حالات استخدام Hbase؟

FINRAK هيئة تنظيم القطاع المالي، هي أكبر منظم مستقل للأوراق المالية في الولايات المتحدة، وتراقب وتنظم ممارسات التداول المالي. تقوم FINRA باستخدام Amazon EMR لتشغيل Apache HBase على Amazon S3 للوصول العشوائي إلى 3 تريليون سجل (هذا العدد يزداد بالمليارات يوميًا) لأحد التطبيقات التفاعلية للبحث عن أحداث السوق ذات الصلة وعرضها. من خلال فصل التخزين والحوسبة، تستطيع FINRA تخزين نسخة واحدة من بياناتها في Amazon S3 وتحديد حجم مجموعتها الخاصة بسعة الحوسبة المطلوبة، بدلاً من تحديد حجم مجموعتها الخاصة بتخزين البيانات في HDFS مع التكرار 3 أضعاف. ويؤدي ذلك إلى توفير التكاليف بنسبة تزيد عن 60% سنويًا، وسهولة قابلية توسّع الحوسبة، وتقليل وقت استعادة المجموعة في منطقة توافر EC2 جديدة من أيام إلى أقل من 30 دقيقة.

تستخدم Monster، الشركة الرائدة عالميًا في الربط بين الأشخاص والوظائف، Apache HBase on Amazon EMR في تخزين بيانات تدفق النقرات والحملات الإعلانية لإجراء التحليلات النهائية. وهذا يُمكّنهم من مراقبة أداء شرائح العملاء المختلفة في حملة معينة بدقة الظهور الواحد. يُمكن لفريق تحليلات Monster البحث بسهولة بين الصفوف لتجميع عدد المشاهدات والنقرات لكل مستخدم لتحديد نشاط الحملة. بالإضافة إلى ذلك، يستخدمون التكامل الوثيق الذي يمتاز به Apache HBase مع نظام Apache Hadoop المتكامل. تقوم Monster بتشغيل Apache Hive على مجموعة Amazon EMR منفصلة للاستعلام عن جدول HBase باستخدام SQL، وهو أمر مفيد للتحليلات الإضافية وتصدير البيانات من Apache HBase إلى Amazon Redshift.  

كيف تساعدك AWS في HBase وHadoop؟

يوفر Amazon EMR إطار Hadoop المُدار الأسهل والأسرع والأيسر كلفةً، مما يمكّن العملاء من معالجة كميات هائلة من البيانات عبر مثيلات EC2 القابلة للتوسع ديناميكيًا. يُمكن للعملاء أيضًا تشغيل الأطر الموزعة الشائعة الأخرى مثل Apache HBase وHive وSpark وPresto وFlink في EMR. 

تعرف على المزيد حول Amazon EMR

ابدأ اليوم استخدام Apache HBase على AWS من خلال إنشاء حساب AWS مجاني.

الخطوات التالية على AWS

التحقق من الموارد الإضافية المتعلقة بالمنتج
تسريع الابتكار مع أكبر مجموعة من خدمات قواعد البيانات  
تسجيل الاشتراك للحصول على حساب مجاني

تمتع بالوصول الفوري إلى الطبقة المجانية من AWS.

تسجيل الاشتراك 
ابدأ في التطوير في وحدة التحكم

بدء الإنشاء في وحدة إدارة تحكم AWS.

تسجيل الدخول