ฟังก์ชันการวิเคราะห์ฐานข้อมูล

ฟังก์ชันการวิเคราะห์ฐานข้อมูลช่วยให้คุณทำการวิเคราะห์ขั้นสูงและการวิเคราะห์การทำเหมืองข้อมูลได้ เช่น การตรวจหาความผิดปกติ การคลัสเตอร์ข้อมูล การสุ่มข้อมูล และการวิเคราะห์ความเกี่ยวข้อง ฟังก์ชันการวิเคราะห์จะใช้ได้เมื่อคุณเชื่อมต่อกับฐานข้อมูล Oracle หรือ Oracle Autonomous Data Warehouse

ไอคอนแนะนำการใช้งาน LiveLabs Sprint

เพื่อแสดงขั้นตอน Database Analytics ในโปรแกรมแก้ไขโฟลว์ข้อมูล คุณต้องเชื่อมต่อกับฐานข้อมูล Oracle หรือ Oracle Autonomous Data Warehouse

ประเภทฟังก์ชัน คำอธิบาย

การตรวจหาความผิดปกติแบบไดนามิค

ตรวจจับความผิดปกติในข้อมูลอินพุตของคุณโดยไม่มีโมเดลที่กำหนดไว้ล่วงหน้า ตัวอย่างเช่น คุณอาจต้องการไฮไลต์การทำรายการทางการเงินที่ผิดปกติ

เมื่อคุณใช้งานฟังก์ชันนี้กับชุดข้อมูลขนาดใหญ่ ให้คอนฟิเกอร์คอลัมน์การแบ่งพาร์ติชันเพื่อประสิทธิภาพสูงสุด

การคลัสเตอร์แบบไดนามิค

คลัสเตอร์ข้อมูลอินพุตของคุณโดยไม่มีโมเดลที่กำหนดไว้ล่วงหน้า ตัวอย่างเช่น คุณอาจต้องการกำหนดและค้นหาเซกเมนต์ลูกค้าสำหรับวัตถุประสงค์ด้านการตลาด

เมื่อคุณใช้งานฟังก์ชันนี้กับชุดข้อมูลขนาดใหญ่ ให้คอนฟิเกอร์คอลัมน์การแบ่งพาร์ติชันเพื่อประสิทธิภาพสูงสุด

ชุดรายการที่พบบ่อย

สำรวจความสัมพันธ์ในข้อมูลโดยการระบุชุดรายการที่มักจะเกิดขึ้นพร้อมกัน เทคนิคการทำเหมืองข้อมูลนี้ยังรู้จักกันในชื่อการเรียนรู้กฎการเชื่อมโยง การวิเคราะห์ความเกี่ยวข้อง หรือการวิเคราะห์ตะกร้าตลาดในอุตสาหกรรมค้าปลีก หากคุณใช้ชุดรายการที่พบบ่อยเป็นเครื่องมือวิเคราะห์ตะกร้าตลาด คุณอาจพบว่าลูกค้าที่ซื้อแชมพูจะซื้อครีมนวดผมด้วย

การดำเนินการนี้ใช้ทรัพยากรสูงและประสิทธิภาพจะขึ้นอยู่กับหลายปัจจัย เช่น ปริมาณชุดข้อมูลอินพุต ชุด ID การทำรายการ และชุดคอลัมน์ค่ารายการ ในการหลีกเลี่ยงไม่ให้ฐานข้อมูลมีประสิทธิภาพการทำงานลดลง ให้ลองใช้เปอร์เซ็นต์การรองรับขั้นต่ำที่สูงขึ้น (ค่าดีฟอลต์คือ 0.25) แล้วค่อยๆ ลดลงเพื่อช่วยให้มีชุดรายการในเอาต์พุตมากขึ้น

การสุ่มเก็บตัวอย่างข้อมูล

เลือกเปอร์เซ็นต์ตัวอย่างแบบสุ่มของข้อมูลจากตาราง คุณแค่ระบุเปอร์เซ็นต์ของข้อมูลที่ต้องการเก็บตัวอย่าง ตัวอย่างเช่น คุณอาจต้องการสุ่มเก็บตัวอย่างข้อมูลของคุณสิบเปอร์เซ็นต์

การสร้างโทเค็นข้อความ

วิเคราะห์ข้อมูลข้อความโดยการแยกย่อยเป็นคำเฉพาะและนับการเกิดซ้ำของแต่ละคำ เมื่อคุณรันโฟลว์ข้อมูล Oracle Analytics จะสร้างตารางในฐานข้อมูลที่ชื่อ DR$IndexName$I ซึ่งมีข้อความโทเค็นและรายละเอียดเกี่ยวกับจำนวนโทเค็น ใช้ตาราง DR$IndexName$I เพื่อสร้างชุดข้อมูล

  • ในส่วน เอาต์พุต ให้ใช้ตัวเลือก สร้าง ถัดจากแต่ละฟิลด์เพื่อเลือกคอลัมน์ที่จะสร้างดัชนี

  • ในส่วน พารามิเตอร์ ตามด้วย คอลัมน์ข้อความ ให้คลิก เลือกคอลัมน์ เพื่อเลือกฟิลด์ที่คุณต้องการแยกย่อยเป็นแต่ละคำ ใช้ตัวเลือก คอลัมน์การอ้างอิง<number> เพื่อรวมคอลัมน์หนึ่งหรือหลายรายการในชุดข้อมูลเอาต์พุต ใช้ตัวเลือก ใช้ Lexer ภาษาพิเศษ เพื่อเลือกภาษาเฉพาะ เช่น จีน เดนมาร์ก ดัตช์ อังกฤษ ฟินแลนด์ เยอรมัน นอร์เวย์ ญี่ปุ่น เกาหลี และสวีเดน สำหรับภาษาพิเศษ ดูรายละเอียดเพิ่มเติมเกี่ยวกับภาษาที่รองรับที่ เอกสารของ Oracle Database

การเชื่อมต่อฐานข้อมูลที่คุณใช้สำหรับโฟลว์ข้อมูลจะต้องมีสิทธิ์พิเศษในฐานข้อมูล โปรดตรวจสอบกับผู้ดูแลระบบในเรื่องต่อไปนี้
  • แอคเคาท์ฐานข้อมูลของคุณมี การให้สิทธิ์ EXECUTE ใน CTXSYS.CTX_DDL แก่ชื่อสคีมา
  • คุณใช้การเชื่อมต่อ Oracle Analytics ด้วยชื่อผู้ใช้เดียวกันกับสคีมาที่มีตารางที่มาอยู่ นี่คือแนวทางปฏิบัติที่ดีที่สุดในการหลีกเลี่ยงปัญหาเรื่องสิทธิ์เข้าใช้เมื่อโฟลว์ข้อมูลทำงาน
  • คอลัมน์ตารางฐานข้อมูลที่คุณกำลังวิเคราะห์ไม่มีดัชนี CONTEXT หากมีดัชนี CONTEXT ในตารางฐานข้อมูลที่คุณกำลังวิเคราะห์ ให้ย้ายดัชนีนั้นออกก่อนที่จะรันโฟลว์ข้อมูลการสร้างโทเค็นข้อความ

ชุดเวลา

ชุดเวลาเป็นเทคนิคการทำเหมืองข้อมูลที่คาดการณ์มูลค่าเป้าหมายตามประวัติที่ทราบของค่าเป้าหมาย อินพุตในการวิเคราะห์ชุดเวลาเป็นลำดับของค่าเป้าหมาย ซึ่งจะให้การประมาณของค่าเป้าหมายสำหรับแต่ละช่วงเวลา ซึ่งสามารถรวมช่วงเวลาได้สูงสุด 30 ช่วงเวลาที่เกินจากข้อมูลในอดีต

โมเดลยังคำนวณสถิติต่าง ๆ ที่วัดความเหมาะสมกับข้อมูลในอดีต สถิติเหล่านี้พร้อมใช้งานเป็นชุดข้อมูลเอาต์พุตเพิ่มเติมผ่านการตั้งค่าพารามิเตอร์

หมายเหตุ: อัลกอริทึมชุดเวลาพร้อมใช้งานจากฐานข้อมูล Oracle เวอร์ชัน 18c เป็นต้นไปเท่านั้น

การเลิกกำหนดจุดอ้างอิงข้อมูล

ย้ายข้อมูลที่เก็บอยู่ในคอลัมน์ไปยังรูปแบบแถว ตัวอย่างเช่น คุณอาจต้องการย้ายหลายคอลัมน์ที่แสดงค่าเมตริครายรับสำหรับแต่ละปัไปยังคอลัมน์รายรับเดียวที่มีหลายแถวค่าสำหรับไดเมนชันปี คุณแค่เลือกคอลัมน์เมตริคที่จะย้ายและระบุชื่อให้กับคอลัมน์ใหม่ คุณจะได้รับชุดข้อมูลใหม่ที่มีคอลัมน์น้อยลงและมีแถวมากขึ้น

หมายเหตุ: ในการใช้ฟังก์ชันการวิเคราะห์ ให้ตรวจสอบว่าผู้ดูแลระบบได้ใช้งานฟังก์ชันการวิเคราะห์แล้ว (คอนโซล, ระบบขั้นสูง, ประสิทธิภาพและการทำงานร่วมกัน, ใช้งานโหนดการวิเคราะห์ฐานข้อมูลในโฟลว์ข้อมูล)