خيارات ترحيل البيانات

يوفر Oracle العديد من الخيارات لترحيل بيانات HDFS وترحيل البيانات المجمع باستخدام Oracle Data Transfer Appliance وترحيل بيانات تعريف المجموعة.

إرشادات ترحيل البيانات

بعد تحديد البيانات المطلوب نقلها وكيف سيتم هيكلها في Oracle Cloud Infrastructure، حدد الطريقة المطلوب استخدامها لنقل البيانات من موقعها الحالي إلى Oracle Cloud Infrastructure. المكون الهام من هذه العملية هو الاتصال بـ Oracle Cloud Infrastructure. تعتمد سعة المعالجة على حجم الاتصال.

يدعم Oracle Cloud Infrastructure العديد من مستويات الاتصال. يمكن أن تتراوح الاتصالات من أي مكان من 10 ميجابايت/ثانية إلى 10 Gbps. حساب حجم مجموعة البيانات وسعة معالجة الاتصال، قد يكون ترحيل البيانات بسيطًا كنسخة مباشرة، أو قد تحتاج إلى أجهزة متخصصة (مثل خدمة نقل البيانات) لنقل البيانات.

يوضح الجدول التالي توقع كم يستغرق نقل البيانات إلى Oracle Cloud Infrastructure، بناءً على عرض النطاق الترددي للاتصال وحجم مجموعة البيانات.
  وقت تصدير البيانات التقريبي
حجم مجموعة البيانات 10Mbps 100Mbps 1 Gbps 10 Gbps خدمة نقل البيانات
10 تيرابايت 92 يومًا 9 أيام 22 ساعة ساعتان أسبوع واحد
100 تيرابايت 1,018 يومًا 101 يومًا 10 أيام 24 ساعة أسبوع واحد
500 تيرابايت 5.092 يوم 509 يومًا 50 يوم 5 أيام أسبوع واحد
1 PB 10,185 يوم 1,018 يومًا 101 يومًا 10 أيام أسبوعان

خدمة نقل البيانات

يقدم Oracle الحلول غير المتصلة لنقل البيانات والتي تتيح لك ترحيل البيانات إلى Oracle Cloud Infrastructure. يمكنك أيضًا تصدير البيانات الموجودة حاليًا في Oracle Cloud Infrastructure إلى مركز البيانات في وضع عدم الاتصال. لا يكون نقل البيانات عبر الإنترنت العام ممكنًا دائمًا بسبب التكاليف عالية الشبكة، واتصال الشبكة غير المناسب، وأوقات التحويل الطويلة، وشائف السرية. وتتعامل حلول التحويل على هذه النقاط من خلال سهولة الاستخدام، وتوفير تحميل سريع للبيانات مقارنة بالنقل الإضافي للبيانات.
  • تحويل البيانات على أساس القرص - تقوم بإرسال البيانات كملفات على قرص السلعة المشفر إلى موقع تحويل Oracle. المشغلات الموجودة في موقع تحويل Oracle لتحميل الملفات إلى رزمة تخزين وحدة أو حفظ تخزين محددة في الأراضي المستأجرة.
  • نقل البيانات المستند إلى التطبيق - يمكنك إرسال البيانات كملفات على الأجهزة الآمنة والكفاءة، إلى جانب تطبيقات التخزين التي يدعمها Oracle إلى موقع نقل Oracle. المشغلات الموجودة في موقع تحويل Oracle لتحميل البيانات إلى رزمة تخزين وحدة أو حفظ تخزين محددة في الأراضي المستأجرة.

ترحيل Hfs

يمكنك ترحيل البيانات من خدمة HDFS خارجية إلى Oracle Cloud Infrastructure بعدة طرق مختلفة.

وهناك اعتبار أساسي هو كم ما يلزم من البيانات ونقله وما إذا كان ذلك ضروريًا لنقل البيانات "عبر السلك" مع توفير الوقت والموارد المطلوبة لنقل البيانات. في حالة وجود عرض النطاق الترددي وموارد مجموعة مصدر كافية لدعمها، يوجد خياران مرتبطان:

  • DistCp إلى Object Storage
  • DistCp إلى HDFS

بالنسبة لنسخة تخزين الكائن، يجب اتصال مجموعة المصدر فقط بالإنترنت، وكذلك إعداد توافق HDFS (Apache Hadoop) أو S 3 (Cloudera وHortonworks). في حالة استخدام توافق S 3، يمكن نسخ البيانات فقط في المنطقة الرئيسية للأرض المستأجرة.

بعد أن يتم وضع المتطلبات الأساسية، عليك نقل البيانات عن طريق تشغيل DistCp مقابل هدف HDFS المصدر في رزمة تخزين كائن. توضح الصياغة التالية نسخة إلى المنطقة الشرقية الأمريكية (Ashburn) تخزين الوحدة (واستبدال المتغيرات بالقيم الصحيحة):

hadoop distcp -Dfs.s3a.secret.key='<SECRET_KEY>' 
-Dfs.s3a.access.key='<ACCESS_KEY>' \
-Dfs.s3a.path.style.access=true 
-Dfs.s3a.paging.maximum=1000 \
-Dfs.s3a.endpoint='https://<object_storage_namespace>.compat.objectstorage.us-ashburn-1.oraclecloud.com' \
/hdfs_target s3a://<BUCKET_NAME>/ 

وعلى العكس من ذلك، يمكن تبديل هدف Hfs وهدف s 3 لنسخ البيانات من تخزين الكائنات إلى HDFS. تعمل هذه الطريقة مع Cloudera وHortonworks وSApache Hadoop.

الخيار الثاني هو إنشاء مجموعة Hadoop في Oracle Cloud Infrastructure، فتأكد من اتصال مجموعة المصدر ومجموعة Oracle Cloud Infrastructure عن طريق الاتصال، وتشغيل DistCp بين المجموعات. كما يعمل هذا الأسلوب مع Apache Hadoop, Cloudera, وHortonworks.

بالنسبة لمجموعات MapR، يتم ترحيل البيانات عن طريق إعداد عملية النسخ المتطابق البعيدة بوحدة التخزين بين المجموعات.

جهاز نقل البيانات

يعتبر Oracle Data Transfer Appliance خيارًا آخر لنقل البيانات عندما لا يكون نقل البيانات على برقيًا قابلاً للتطبيق.

قد يوجد عرض النطاق الترددي أو قيود الموارد في المجموعة المصدر أو التقارب بالنسبة لمنطقة Oracle Cloud Infrastructure قد يؤدي إلى تحديد إتاحة FastConnect. يمكن أن تكون مجموعة البيانات كبيرة للغاية بحيث لا يمكن نسخها. في هذه الحالات، يمكن لـ Oracle إرسال جهاز نقل بيانات يمكنك توزيعه في مركز البيانات واستخدامه كهدف DistCp لبيانات HDFS.

ترحيل بيانات تعريف المجموعة

يتفاوت أسلوب ترحيل ميتاديتا العنقود إلى Oracle Cloud Infrastructure بين Cloudera وHortonworks وMapR وSApache.

Cloudera

بالنسبة لمجموعات Cloudera، يتم دعم ثلاثة أنواع من قواعد البيانات لميتاديتا المجموعة: Postgres وMySQL وOracle.

يتم تضمين خطوات نسخ قواعد بيانات Cloudera Manager في وثائق Cloudera Enterprise. يمكنك عندئذ استيراد هذه البيانات إلى مجموعة تستخدم Cloudera في Oracle Cloud Infrastructure.

Hortonworks

وبالنسبة لأنشطة الألوان، يتم دعم نفس قواعد البيانات كما في Cloudera. بالنسبة لـ Ambari، يمكن تصدير مخطط من المجموعة الموجودة واستخدامه لتكوين توزيع Oracle Cloud Infrastructure Hortonworks.

MapR

اتبع الخطوات الموجودة في أفضل ممارسات MapR للحصول على وثائق MapR احتياطيًا. يمكنك عندئذ استيراد هذه البيانات في مجموعة Oracle Cloud Infrastructure MapR.

آباتشي

بالنسبة إلى Apache Hadoop، يتم دعم نفس قواعد البيانات الخاصة بـ Cloudera وHortonworks، باستخدام نفس الإجراءات المتعلقة بالماجر وHive وHBase.