معالجة سجلات الاستخراج

تسمى العملية التي تحدد السجلات وتنتج مخرجات لكل سجل للكتابة في ملف للتكامل مع الأنظمة الخارجية عملية استخراج. يمكن استخدام نموذج الاستخراج المعتمد على الخوارزمية المساعدة للتحكم في مجموعة المعالجة الأساسية (F1-PDBEX) كنموذج.

المسار السريع: الرجاء قراءة الموضوع عمليات مخصصة. يتم تطبيق المعلومات الخاصة بالبرنامج المساعد "تحديد السجلات" وبعض المعلومات حول البرنامج المساعد "معالجة السجل" على عمليات الاستخراج. يركز هذا الموضوع على الجوانب الفريدة لاستخراج العمليات.
تتضمن العملية التي يوفرها النظام معلمات لتكوين مسار الملف واسمه للملف الذي تم إنشاؤه. يدعم مسار الملف كل الوظائف الموضحة في الموضوع الإشارة إلى معرفات URI. يدعم اسم الملف متغيرات استبدال النظام، مثل رقم التشغيل ورقم تسلسل العمليات والمستخدم وتاريخ/وقت التشغيل. تدعم العملية أيضًا الضغط إذا تم استخدام امتداد مناسب. لمزيد من المعلومات، ارجع إلى وصف معلمة اسم الملف في التحكم في مجموعة المعالجة.
ملاحظة: لمزيد من المعلومات حول دعم استبدال قيمة أعمال باسم الملف، ارجع إلى اسم الملف المرن/كتابة ملفات متعددة.

بالنسبة لعمليات الاستخراج، تكون خوارزمية "معالجة السجل" هي المسؤولة عن إرجاع البيانات التي يجب كتابتها بملف في مثيل XML واحد أو أكثر بالإضافة إلى أسماء المخطط التي تصف مثيلات XML. سيقوم البرنامج بكتابة البيانات للملف كما يشير التنسيق في معلمة مجموعة معالجة تنسيق الملف. كإعداد افتراضي، تستخدم الخدمة تنسيق إطار عمل تطبيق الخدمات والمرافق من أوراكل للتاريخ والوقت. ولتجاوز هذا واستخدام تنسيق XSD، يمكنك إعداد معلمة مجموعة معالجة "تنسيق التاريخ/الوقت" على القيمة "XSD".

في حالة استيفاء أحد المخططات الموجودة لمتطلبات المخرجات، فمن الممكن استخدامه. بخلاف ذلك، يجب تحديد منطقة بيانات للإشارة إلى تنسيق مخرجات السجلات، حسب الحاجة.

يوجد خياران لتصميم وتكوين خوارزمية معالجة السجل:

  • إنشاء نوع خوارزمية معالجة سجل معين يتضمن منطق الاستخراج. يوفر المنتج نوع خوارزمية أساسيًا يوضح الأسلوب الأساسي المطلوب اتباعه. لمزيد من المعلومات، ارجع إلى نوع الخوارزمية العملية العامة- استخراج سجل العمليات النموذجي (F1-GENPROCEX).

  • إنشاء نوع تكامل ملفات يحدد السجلات المطلوب تضمينها في الاستخراج وتكوين عنصر تحكم في مجموعة معالجة مستنِد إلى خوارزمية مساعدة ويشير إلى نوع التكامل هذا. لمزيد من المعلومات حول تنفيذ هذا النوع من الوظائف، ارجع إلى استخراج باستخدام تكامل الملفات.

قد يوفر منتج الحافة المحدد أنواع خوارزميات "معالجة السجل" أخرى غير تقليدية. استخدم الاستعلام عن نوع الخوارزمية وابحث عن سجلات كيان الخوارزمية هذا.

التجميع حسب نقطة توصيل XML للسجل

عند تكوين عملية استخراج يجب أن تُنشئ المخرجات بتنسيق XML، يمكن أن ينتج عن الخوارزمية المساعدة "معالجة السجل" مخططات متعددة بمعلومات تكون كلها جزءًا من نفس السجل العام. على سبيل المثال، يمكن أن تتضمن المخرجات معلومات الحساب وتفاصيل اتفاقية الخدمة المرتبطة:
<account type="group"
    <accountId>1234567890</accountId>
    ...
</account>
<sa type="group"
    <saId>123457665</saId>
    ...
</sa>
<sa type="group"
    <saId>1234588913</saId>
    ...
</sa>
في هذه الحالة، قد يكون مطلوبًا ضم كل هذه المعلومات في علامة تجميع XML بحيث يتم تجميع كل المعلومات الخاصة بسجل واحد معًا. وبما أن الخوارزمية المساعدة "معالجة السجل" قد تقوم بإرجاع سجلات عنوان أو تذييل ليست جزءًا من معلومات استخراج سجل محدد، لا تتعرف عملية مجموعة المعالجة على المخططات التي تنتمي إلى بعضها منطقيًا من المخططات التي يتم إرجاعها بواسطة الخوارزمية المساعدة "معالجة السجل". لذا، يجب استخدام معلمة المخرجات "نقطة توصيل XML للسجل" في مجموعة المخططات للإشارة إلى نقطة توصيل XML الخارجية المطلوب استخدامها لتجميع المعلومات المرتبطة معًا. على سبيل المثال:
<SchemaInstance>
<recordXMLNode>record</recordXMLNode>
<schemaName>CM-AccountRecord</schemaName>
<schemaType>F1DA</schemaType>
<data><account><accountId>1234567890</accountId>...</data>
</SchemaInstance>
<SchemaInstance>
<recordXMLNode>record</recordXMLNode>
<schemaName>CM-SAInfo</schemaName>
<schemaType>F1DA</schemaType>
<data><sa><saId>123457665</saId>... </data>
</SchemaInstance>
<SchemaInstance>
<recordXMLNode>record</recordXMLNode>
<schemaName>CM-SAInfo</schemaName>
<schemaType>F1DA</schemaType>
<data><sa><saId>1234588913</saId>... </data>
</SchemaInstance>
سيتم تجميع كل المخططات الناتجة عن استدعاء واحد للخوارزمية المساعدة "معالجة السجل" التي لها نفس نقطة توصيل XML للسجل، وذلك في المخرجات المكتوبة ضمن علامة XML هذه، كما هو موضح أدناه:
<root>
<record>
<account>
    <accountId>1234567890</accountId>
    ...
</account>
<sa>
    <saId>123457665</saId>
    ...
</sa>
<sa>
    <saId>1234588913</saId>
    ...
</sa>
</record>
<record>
<account>
    <accountId>987654320</accountId>
    ...
</account>
<sa>
    ...
</sa>
</record>
</root>

استخراج متعدد سلاسل العمليات

عند استخراج البيانات، من الممكن أن يتطلب حجم البيانات تشغيل المهام ذات سلاسل العمليات المتعددة. في هذه الحالة، يتم إنشاء ملف منفصل برقم سلسلة العمليات المضمن في اسم الملف. يمكنك تضمين رقم سلسلة العمليات بشكل استباقي كمتغير استبدال عند الإشارة إلى اسم الملف. إذا لم يكن الأمر كذلك، يقوم النظام بإلحاق رقم سلسلة العمليات.

وكراحة، يدعم النظام ربط ملفات الاستخراج التي تنتجها سلاسل العمليات المختلفة في النهاية. يقوم النظام بذلك من خلال البحث عن الملفات التي تتطابق أسماء الملفات الخاصة بها باستثناء رقم سلسلة العمليات. على هذا النحو، لا يمكن أن يحتوي اسم الملف على تاريخ أو وقت إذا كانت معلمة التركيب صحيحة. الرجاء مراعاة ما يلي فيما يتعلق بميزة التركيب:

  • يتم تركيب محتويات كل ملف معًا "كما هي". إذا كانت الملفات الفردية تحتوي على معلومات الرأس أو التذييل أو الملخص، فلا يوجد منطق لتجميع تلك المعلومات في الملف المتعاقب. إذا كنت تريد عنوانًا واحدًا أو تذييلًا أو ملخصًا واحدًا، يجب تشغيل استخراج سلسلة عمليات فردية.
  • لا يتم دعم التركيب إذا كان اسم الملف يشير إلى ضرورة استخدام الضغط المضغوط.
  • يتم الاحتفاظ بملفات سلسلة العمليات الفردية.
  • لاحظ أنه إذا كان تنسيق الملف هو XML، ستتم كتابة الملفات المكتوبة لسلاسل العمليات الفردية بامتداد ".tmp".

تخطي السجلات

وفقًا للإعدادات الافتراضية، تتوقع عملية الاستخراج إرجاع مخطط واحد أو أكثر بواسطة كل استدعاء للخوارزمية المساعدة "معالجة السجل". (عند تصميم أي عملية نموذجيًا، تقوم خوارزمية "تحديد السجلات" بتحديد السجلات التي يجب معالجتها فقط ولا تحتاج خوارزمية "معالجة السجل" إلى تأكيد ما إذا كان يجب أن يكون السجل جزءًا من المعالجة أم لا.) ومع ذلك، إذا كانت هناك حاجة للتحقق من شرط في الخوارزمية المساعدة "معالجة اللسجل" وتم الوصول إلى أنه لا توجد حاجة لاستخراج بيانات لهذا السجل، يجب أن تقوم خوارزمية "معالجة السجل" بإرجاع معلمة المخرجات "تم التخطي" إلى القيمة "صواب" حتى لا يكتب البرنامج صفًا فارغًا.

لاحظ أن خوارزمية "معالجة السجلات" الأساسية لأنواع تكامل الملفات (F1-FILEX-PR) ستقوم بتعيين المعلمة "تم التخطي" على القيمة صواب إذا لم يتم إرجاع أي بيانات بواسطة خوارزمية سجل استخراج سجلات تكامل الملفات.

تكوين عملية جديدة

يتم تطبيق النقاط الموثقة في الموضوع المرتبطة بتكوين عملية مخصصة جديدة فيما يتعلق بخوارزمية "تحديد السجلات" على عمليات الاستخراج.

بالنسبة لخوارزمية "معالجة السجلات"، فإنها مسؤولة عن عرض مثيل مخطط واحد أو أكثر تم ملؤه بالمعلومات التي يجب كتابتها بالملف. في حالة عدم تقديم منتج Edge الخاص بك لخوارزمية مساعدة مناسبة، قم بإنشاء سكريبت خوارزمية مساعدة حيث يكون كيان الخوارزمية هو التحكم في مجموعة المعالجة - سجل المعالجة. لاحظ أن الخوارزمية المساعدة تتلقى كافة المعلومات التي تم تحديدها في SQL المحدد في الخوارزمية المساعدة "تحديد السجلات".

ارجع إلى تكوين عملية استخراج باستخدام نوع تكامل الملفات للحصول على معلومات حول تصميم عمليات الاستخراج باستخدام هذا التكوين.

إذا كان سكريبت المعالجة الجديد مطلوبًا، حدد الخوارزمية ونوع الخوارزمية للسكريبت الذي تم إنشاؤه حديثًا. قم بإنشاء تحكم في مجموعة معالجة عن طريق تكرار النموذج الأساسي F1-PDBEX. قم بإضافة الخوارزميات التي تم إنشاؤها أعلاه وتكوين المعلمات حسب الحاجة. لاحظ أنه يمكنك تكوين معلمات مخصصة لغرض معين بالتحكم في مجموعة المعالجة إذا لزم الأمر. كل من قيمتي معلمة مجموعة المعالجة المخصصة والأساسية متاحة للخوارزميتين المساعدتين "تحديد السجلات" و"معالجة السجلات".