إعداد المستندات للتحليل باستخدام نموذج فهم مستند OCI

يمكن استخدام الفئات في مخزن كائنات OCI لتخزين المستندات التي تريد تحليلها، ثم تكوين مجموعة بيانات للوصول إلى هذه المستندات في Oracle Analytics.

عادةً ما تقوم بتخزين مستندات الإدخال ونماذج الذكاء الاصطناعي في حساب Oracle Cloud نفس (مثيل قاعدة البيانات المؤجر)، مما يسهل عملية الإعداد في Oracle Analytics.

إذا تم تخزين مستندات الإدخال ونماذج الذكاء الاصطناعي في مثيلين مؤجرين مختلفين :
  • تأكد من أن إمكانية رؤية فئة التخزين التي تحتوي على المستندات المدخلة هي عامة. يرجى الاطلاع على تغيير إمكانية رؤية فئة.
  • قم بتعبئة مجموعة بيانات الإدخال لتدفق البيانات باستخدام عناوين URL للمستندات الفردية بدلاً من عنوان URL واحد لحاوية OCI حيث يتم تخزين المستندات.
في تشغيل واحد، يمكن أن يعالج Oracle Analytics تدفقات البيانات ما يصل إلى 10,000 مستند للنماذج المدربة المسبقة و2,000 مستند للنماذج المخصص. إذا كان لديك أكثر من الحد الأقصى للعدد في OCI's Object Storage وArchive Storage، فقم بتكوين عدة حزم تحتوي على ما لا يزيد عن الحد الأقصى لعدد المستندات في كل واحدة. بعد ذلك، قم بتكوين مجموعة بيانات وتدفق بيانات منفصلين لكل مجموعة، واستخدم تسلسلًا لمعالجة تدفقات البيانات بشكل تسلسلي.

يمكنك استخدام مجموعة خاصة أو عامة يمكن لمستخدم OCI الوصول إليها والتي تتوافق مع حدود OCI العامة على المستندات. اطلع على وثائق OCI.

  1. في وحدة تحكم OCI، انتقل إلى مخزن الكائنات ومخزن الأرشيف، ثم قم بتكوين فئة جديدة لتخزين مستنداتك.

  2. في تخزين الكائنات وتخزين الأرشيف، انقر على اسم المجموعة، ثم ضمن منطقة الكائنات بالصفحة، انقر على تحميل وقم بتحميل مستنداتك.
    تأكد من أن المجموعة لا تحتوي على ملفات غير ضرورية لا تريد معالجتها. يعالج Oracle Analytics كل ملف في الفئة.
  3. لكل فئة، قم بإضافة عنوان URL للفئة إلى ملف قيم مفصولة بفاصلة (CSV).
    1. في مخزن الكائنات، حدد الفئة لعرض المستندات في مربع حوار الكائنات.
    2. انسخ عنوان URL من شريط عنوان URL في المستعرض.
    3. قم بتكوين ملف CSV بالحقول المعرف واسم الفئة وعنوان URL الفئة.
    4. الصق عنوان URL الفئة في ملف CSV كقيمة عنوان URL الفئة.
      وبدلاً من ذلك، إذا تم تخزين مستندات الإدخال ونماذج الذكاء الاصطناعي في مثائل مؤجرة مختلفة ، فأضفها بشكل فردي إلى ملف CSV.
      قم بتكوين ملف CSV يحتوي على حقول المعرف، واسم المستند، وعنوان URL للمستند. بالنسبة لكل مستند في تخزين الكائنات، انقر على أيقونة علامة الحذف أيقونة الحذف، وحدد عرض تفاصيل الكائن، وانسخ قيمة الاسم و قيمة مسار URL (URI).

      ألصق قيمة الاسم كاسم مستند، ثم ألصق قيمة مسار URL (URI) كعنوان URL للمستند.

  4. في Oracle Analytics، لكل مجموعة تستخدمها لتخزين مستنداتك، انقر على تكوين، ثم مجموعة البيانات.
  5. قم بتحميل ملف CSV الذي قمت بتكوينه في الخطوة 3، واحفظ مجموعة البيانات.
    كرر الخطوتين 4 و5 لكل فئة. إذا كان لديك أكثر من 10000 مستند، فقم بتكوين فئات متعددة تصل إلى 10000 مستند وقم بتكوين مجموعة بيانات منفصلة لكل فئة.