نظرة عامة على تصنيف المستندات واستخراج القيمة الأساسية

في Oracle Cloud Infrastructure (OCI)، يقدم Document Understanding نماذج الذكاء الاصطناعي المدربة مسبقًا التي تستخرج النصوص والجداول والبيانات الرئيسية الأخرى من ملفات المستند. يمكنك تنفيذ تصنيف المستندات أو استخراج القيمة الرئيسية في مستند، واستخدم البيانات المستخرجة كجزء من تحليلك في Oracle Analytics.

كما يتيح لك Document Understanding تكوين نماذج مخصصة لاستخراج القيمة الرئيسية وتصنيف المستند.

في Oracle Analytics، تستخدم تدفقات البيانات لتطبيق نماذج ذكاء Document Understanding الاصطناعي على بياناتك.

يدعم Oracle Analytics عدة نماذج ذكاء اصطناعي مدربة مسبقًا من متوفرة من Document Understanding:
  • النماذج المدربة مسبقًا المدعومة في Oracle Analytics
    • تصنيف المستند
    • استخراج القيمة الرئيسية (للإيصالات والفواتير ومعرفات برنامج التشغيل وجوازات السفر)
  • النماذج المخصصة المدعومة في Oracle Analytics
    • تصنيف المستند المخصص
    • استخراج قيمة المفتاح المخصص

يجب إعداد النماذج المخصصة وتكوينها في OCI Console قبل أن تتمكن من استخدامها في Oracle Analytics. أولاً، استخدم OCI Data Labeling لتكوين مجموعة بيانات جديدة يمكنك استخدامها لتدريب النموذج ثم تكوين نموذجك المخصص. يرجى الاطلاع على OCI Document Understanding - النماذج المخصصة.

مثال المخرجات من نموذج تصنيف مستند

في هذا المثال، يُطبق تدفق البيانات نموذج تصنيف المستندات مدرب مسبقَا على المستندات بتنسيق JPG للتنبؤ بما إذا كانت إيصالات أم لا، كما يُخرج نتائج التحليل إلى مجموعة بيانات. تتضمن مجموعة البيانات قيمة RECEIPT لـ "نوع المستند"، ومستوى تنبؤ "الثقة" لكل مستند.


فيما يلي وصف GUID-D4540502-D2A4-43CB-B023-E9F27C43579E-default.png
.png

قبل البدء: