ฟังก์ชันการวิเคราะห์ฐานข้อมูล

ฟังก์ชันการวิเคราะห์ฐานข้อมูลช่วยให้คุณทำการวิเคราะห์ขั้นสูงและการวิเคราะห์การทำเหมืองข้อมูลได้ เช่น การตรวจหาความผิดปกติ การคลัสเตอร์ข้อมูล การสุ่มข้อมูล และการวิเคราะห์ความเกี่ยวข้อง ในการใช้ฟังก์ชันการวิเคราะห์ ให้เชื่อมต่อกับฐานข้อมูล Oracle หรือ Oracle Autonomous AI Database (การวิเคราะห์จะได้รับการคำนวณในฐานข้อมูล ไม่ใช่ใน Oracle Analytics)

ไอคอนแนะนำการใช้งาน LiveLabs Sprint

เพื่อแสดงขั้นตอน Database Analytics ในโปรแกรมแก้ไขโฟลว์ข้อมูล คุณต้องเชื่อมต่อกับฐานข้อมูล Oracle หรือ Oracle Autonomous AI Database

ประเภทฟังก์ชัน คำอธิบาย

การตรวจหาความผิดปกติแบบไดนามิค

ตรวจจับความผิดปกติในข้อมูลอินพุตของคุณโดยไม่มีโมเดลที่กำหนดไว้ล่วงหน้า ตัวอย่างเช่น คุณอาจต้องการไฮไลต์การทำรายการทางการเงินที่ผิดปกติ

เมื่อคุณใช้งานฟังก์ชันนี้กับชุดข้อมูลขนาดใหญ่ ให้คอนฟิเกอร์คอลัมน์การแบ่งพาร์ติชันเพื่อประสิทธิภาพสูงสุด

การคลัสเตอร์แบบไดนามิค

คลัสเตอร์ข้อมูลอินพุตของคุณโดยไม่มีโมเดลที่กำหนดไว้ล่วงหน้า ตัวอย่างเช่น คุณอาจต้องการกำหนดและค้นหาเซกเมนต์ลูกค้าสำหรับวัตถุประสงค์ด้านการตลาด

เมื่อคุณใช้งานฟังก์ชันนี้กับชุดข้อมูลขนาดใหญ่ ให้คอนฟิเกอร์คอลัมน์การแบ่งพาร์ติชันเพื่อประสิทธิภาพสูงสุด

ชุดรายการที่พบบ่อย

สำรวจความสัมพันธ์ในข้อมูลโดยการระบุชุดรายการที่มักจะเกิดขึ้นพร้อมกัน เทคนิคการทำเหมืองข้อมูลนี้ยังรู้จักกันในชื่อการเรียนรู้กฎการเชื่อมโยง การวิเคราะห์ความเกี่ยวข้อง หรือการวิเคราะห์ตะกร้าตลาดในอุตสาหกรรมค้าปลีก หากคุณใช้ชุดรายการที่พบบ่อยเป็นเครื่องมือวิเคราะห์ตะกร้าตลาด คุณอาจพบว่าลูกค้าที่ซื้อแชมพูจะซื้อครีมนวดผมด้วย

การดำเนินการนี้ใช้ทรัพยากรสูงและประสิทธิภาพจะขึ้นอยู่กับหลายปัจจัย เช่น ปริมาณชุดข้อมูลอินพุต ชุด ID การทำรายการ และชุดคอลัมน์ค่ารายการ ในการหลีกเลี่ยงไม่ให้ฐานข้อมูลมีประสิทธิภาพการทำงานลดลง ให้ลองใช้เปอร์เซ็นต์การรองรับขั้นต่ำที่สูงขึ้น (ค่าดีฟอลต์คือ 0.25) แล้วค่อยๆ ลดลงเพื่อช่วยให้มีชุดรายการในเอาต์พุตมากขึ้น

การสุ่มเก็บตัวอย่างข้อมูล

เลือกเปอร์เซ็นต์ตัวอย่างแบบสุ่มของข้อมูลจากตาราง คุณแค่ระบุเปอร์เซ็นต์ของข้อมูลที่ต้องการเก็บตัวอย่าง ตัวอย่างเช่น คุณอาจต้องการสุ่มเก็บตัวอย่างข้อมูลของคุณสิบเปอร์เซ็นต์

การสร้างโทเค็นข้อความ

วิเคราะห์ข้อมูลข้อความโดยการแยกย่อยเป็นคำเฉพาะและนับการเกิดซ้ำของแต่ละคำ เมื่อคุณรันโฟลว์ข้อมูล Oracle Analytics จะสร้างตารางในฐานข้อมูลที่ชื่อ DR$IndexName$I ซึ่งมีข้อความโทเค็นและรายละเอียดเกี่ยวกับจำนวนโทเค็น ใช้ตาราง DR$IndexName$I เพื่อสร้างชุดข้อมูล

  • ในส่วน เอาต์พุต ให้ใช้ตัวเลือก สร้าง ถัดจากแต่ละฟิลด์เพื่อเลือกคอลัมน์ที่จะสร้างดัชนี

  • ในส่วน พารามิเตอร์ ตามด้วย คอลัมน์ข้อความ ให้คลิก เลือกคอลัมน์ เพื่อเลือกฟิลด์ที่คุณต้องการแยกย่อยเป็นแต่ละคำ ใช้ตัวเลือก คอลัมน์การอ้างอิง<number> เพื่อรวมคอลัมน์หนึ่งหรือหลายรายการในชุดข้อมูลเอาต์พุต ใช้ตัวเลือก ใช้ Lexer ภาษาพิเศษ เพื่อเลือกภาษาเฉพาะ เช่น จีน เดนมาร์ก ดัตช์ อังกฤษ ฟินแลนด์ เยอรมัน นอร์เวย์ ญี่ปุ่น เกาหลี และสวีเดน สำหรับภาษาพิเศษ ดูรายละเอียดเพิ่มเติมเกี่ยวกับภาษาที่รองรับที่ เอกสารของ Oracle Database

การเชื่อมต่อฐานข้อมูลที่คุณใช้สำหรับโฟลว์ข้อมูลจะต้องมีสิทธิ์พิเศษในฐานข้อมูล โปรดตรวจสอบกับผู้ดูแลระบบในเรื่องต่อไปนี้
  • แอคเคาท์ฐานข้อมูลของคุณมี การให้สิทธิ์ EXECUTE ใน CTXSYS.CTX_DDL แก่ชื่อสคีมา
  • คุณใช้การเชื่อมต่อ Oracle Analytics ด้วยชื่อผู้ใช้เดียวกันกับสคีมาที่มีตารางที่มาอยู่ นี่คือแนวทางปฏิบัติที่ดีที่สุดในการหลีกเลี่ยงปัญหาเรื่องสิทธิ์เข้าใช้เมื่อโฟลว์ข้อมูลทำงาน
  • คอลัมน์ตารางฐานข้อมูลที่คุณกำลังวิเคราะห์ไม่มีดัชนี CONTEXT หากมีดัชนี CONTEXT ในตารางฐานข้อมูลที่คุณกำลังวิเคราะห์ ให้ย้ายดัชนีนั้นออกก่อนที่จะรันโฟลว์ข้อมูลการสร้างโทเค็นข้อความ

ชุดเวลา

ชุดเวลาเป็นเทคนิคการทำเหมืองข้อมูลที่คาดการณ์มูลค่าเป้าหมายตามประวัติที่ทราบของค่าเป้าหมาย อินพุตในการวิเคราะห์ชุดเวลาเป็นลำดับของค่าเป้าหมาย ซึ่งจะให้การประมาณของค่าเป้าหมายสำหรับแต่ละช่วงเวลา ซึ่งสามารถรวมช่วงเวลาได้สูงสุด 30 ช่วงเวลาที่เกินจากข้อมูลในอดีต

โมเดลยังคำนวณสถิติต่าง ๆ ที่วัดความเหมาะสมกับข้อมูลในอดีต สถิติเหล่านี้พร้อมใช้งานเป็นชุดข้อมูลเอาต์พุตเพิ่มเติมผ่านการตั้งค่าพารามิเตอร์

หมายเหตุ: อัลกอริทึมชุดเวลาพร้อมใช้งานจากฐานข้อมูล Oracle เวอร์ชัน 18c เป็นต้นไปเท่านั้น

การเลิกกำหนดจุดอ้างอิงข้อมูล

ย้ายข้อมูลที่เก็บอยู่ในคอลัมน์ไปยังรูปแบบแถว ตัวอย่างเช่น คุณอาจต้องการย้ายหลายคอลัมน์ที่แสดงค่าเมตริครายรับสำหรับแต่ละปัไปยังคอลัมน์รายรับเดียวที่มีหลายแถวค่าสำหรับไดเมนชันปี คุณแค่เลือกคอลัมน์เมตริคที่จะย้ายและระบุชื่อให้กับคอลัมน์ใหม่ คุณจะได้รับชุดข้อมูลใหม่ที่มีคอลัมน์น้อยลงและมีแถวมากขึ้น

หมายเหตุ: ในการใช้ฟังก์ชันการวิเคราะห์ ให้ตรวจสอบว่าผู้ดูแลระบบได้ใช้งานฟังก์ชันการวิเคราะห์แล้ว (โปรดดูคอนโซล, การตั้งค่าระบบขั้นสูง, ประสิทธิภาพและการทำงานร่วมกัน, ใช้งานโหนดการวิเคราะห์ฐานข้อมูลในโฟลว์ข้อมูล)