הכנת מסמכים לניתוח עם מודל של OCI Document Understanding

השתמש בתאי אחסון במחסן האובייקטים של OCI כדי לאחסן את המסמכים שתרצה לנתח, ולאחר מכן צור סל נתונים כדי לגשת למסמכים אלו ב-Oracle Analytics.

בדרך כלל מאחסנים מסמכי קלט ומודלים של AI באותו החשבון של Oracle Cloud account (חשבון דייר), מה שמקל על ההקמה ב-Oracle Analytics.

אם מסמכי הקלט שלך והמודלים של AI מאוחסנים בחשבונות דייר שונים:
  • ודא שהניראות של סל האחסון המכיל את מסמכי הקלט שלך היא ציבורי. ראה שנה את הנראות של תא אחסון.
  • אכלס את סל נתוני הקלט לזרימת הנתונים בכתובות URL נפרדות של מסמכים, במקום בכתובת URL אחת לתא אחסון ה-OCI שבו מאוחסנים המסמכים.
זרימות נתונים ב-Oracle Analytics יכולות לעבד עד 10,000 מסמכים בריצה אחת. אם יש לך יותר מ-10,000 מסמכים, ב'מחסן אובייקטים ואחסון בארכיב של OCI' צור מספר תאי אחסון שמכילים לא יותר מ-10,000 מסמכים בכל אחד. לאחר מכן, צור סל נתונים וזרימת נתונים נפרדים בשביל כל תא אחסון, והשתמש ב'רצף' כדי לעבד ברצף את זרימות הנתונים.

תוכל להשתמש בתא אחסון פרטי או ציבורי הנגיש למשתמש ה-OCI ותואם למגבלות הכלליות של OCI בנושא מסמכים. ראה את התיעוד של OCI.

  1. במסוף OCI, נווט אל אחסון אובייקטים & ארכיון אחסון, וצור אוסף נתונים לאחסון המסמכים שלך.

  2. באזור מחסן אובייקטים ואחסון בארכיב, לחץ על שם תא אחסון, ולאחר מכן תחת האזור אובייקטים בדף לחץ על העלה והעלה את המסמכים שלך.
    ודא שתא האחסון לא מכיל קבצים עודפים שאינך מעוניין לעבד. Oracle Analytics מעבד כל קובץ בתא האחסון.
  3. לכל תא אחסון, הוסף את כתובת ה-URL של התא לקובץ ערכים מופרדים בפסיקי (CSV).
    1. במחסן אובייקטים, בחר את תא האחסון להצגת המסמכים בתיבת הדו-שיח 'אובייקטים'.
    2. העתק את כתובת ה-URL משורת כתובת ה-URL של הדפדפן.
    3. צור קובץ CSV עם שדות בשביל מזהה, שם תא אחסון ו-כתובת URL של תא אחסון.
    4. הדבק את כתובת ה-URL של תא האחסון בקובץ ה-CSV כערך כתובת URL של תא אחסון.
      לחלופין, אם מסמכי הקלט שלך והמודלים של AI מאוחסנים בחשבונות דייר שונים, הוסף אותם בנפרד לקובץ ה-CSV.
      צור קובץ CSV עם שדות בשביל מזהה, שם מסמך וכתובת URL למסמך. לכל מסמך במחסן אובייקטים, לחץ על איקון שלוש הנקודות אייקון של שלוש נקודות, בחר את הצג פרטי אובייקט, והעתק את הערך שם ואת הערך נתיב כתובת URL (URI).

      הדבק את הערך 'שם' כ'שם מסמך', ןהדבק את הערך של 'נתיב כתובת URL (URI)' כ'כתובת URL של מסמך'.

  4. ב-Oracle Analytics, לכל תא אחסון שבו אתה משתמש לאחסון המסמכים שלך,לחץ על צור, ולאחר מכן על סל נתונים.
  5. העלה את קובץ ה-CSV שיצרת בשלב 3, ושמור את סל הנתונים.
    חזור על שלבים 4 ו-5 לכל תא אחסון. אם יש לך יותר מ-10,000 מסמכים, תוכל ליצור מספר תאי אחסון של עד 10,000 מסמכים וליצור סל נתונים נפרד עבור כל תא אחסון.