ประมวลผลโมเดล Machine Learning โดยใช้แผนภูมิ Lift และ Gain

แผนภูมิ Lift และ Gain ช่วยให้คุณสามารถเปรียบเทียบโมเดลแมชชีนเลิร์นนิงต่างๆ เพื่อระบุโมเดลที่แม่นยำที่สุด

ภาพรวมการใช้แผนภูมิ Lift และ Gain

แผนภูมิ Lift และ Gain ช่วยให้คุณประเมินโมเดล Machine Learning แบบคาดการณ์ได้โดยการแสดงแผนภูมิสถิติด้านการกำหนดโมเดลในการแสดงข้อมูลของ Oracle Analytics

เมื่อคุณใช้โฟลว์ข้อมูลเพื่อนำโมเดลการจัดประเภทไปใช้กับชุดข้อมูล Oracle Analytics จะช่วยให้คุณสามารถคำนวณค่า Lift และ Gain ได้ จากนั้นคุณสามารถแสดงข้อมูลนี้ัในแผนภูมิเพื่อช่วยประเมินความแม่นยำของโมเดลคาดการณ์และระบุว่าควรใช้โมเดลไหนจึงจะดีที่สุด

คำอธิบาย GUID-BB91080A-9081-4AAD-8448-441240BDCEFE-default.png มีดังนี้
.png

สิ่งที่ต้องใช้

  • Oracle Database หรือ Oracle Autonomous Data Warehouse
  • โมเดลการจัดประเภทที่มีความเป็นไปได้ของการคาดการณ์ (เช่น โมเดลตัวจัดประเภทแบบหลายประเภทที่สร้างขึ้นโดยใช้สคริปต์การฝึกอบรมของ Naive Bayes)

    คุณเข้าใช้โมเดลการคาดการณ์ที่มีอยูได้ในพื้นที่การเรียนรู้ของเครื่องใน Oracle Analytics

ค่าสถิติที่สร้างไว้สำหรับการวิเคราะห์ Lift และ Gain

เมื่อคุณใช้โมเดลการจัดประเภทแบบคาดการณ์กับชุดข้อมูล คุณจะสร้างชุดข้อมูลที่ชื่อ <ชื่อโฟลว์ข้อมูล>_LIFT ที่มีคอลัมน์ต่อไปนี้
  • PopulationPercentile - จำนวนประชากรในชุดข้อมูลที่แบ่งออกเป็น 100 กลุ่มเท่าๆ กัน
  • CumulativeGain - อัตราส่วนระหว่างจำนวนสะสมของเป้าหมายที่เป็นบวกจนถึงเปอร์เซ็นไทล์ดังกล่าว เทียบกับจำนวนรวมของเป้าหมายที่เป็นบวก ยิ่งเส้น Gain สะสมเข้าใกล้มุมบนซ้ายของแผนภูมิมากเท่าไร ค่า Gain ก็ยิ่งมากเท่านั้น แสดงว่ามีสัดส่วนผู้ตอบสนองที่เข้าถึงสูงกว่า โดยมีสัดส่วนลูกค้าที่ติดต่อน้อยกว่า
  • GainChartBaseline - อัตราการตอบสนองโดยรวม : เส้นกราฟแสดงถึงเปอร์เซ็นต์ของเรคคอร์ดที่เป็นบวกซึ่งเราคาดหวังจะได้รับหากเลือกเรคคอร์ดแบบสุ่ม ตัวอย่างเช่น ในแคมเปญการตลาด หากเราติดต่อลูกค้า X% แบบสุ่ม เราจะได้รับการตอบสนองที่เป็นบวกรวม X%
  • LiftChartBaseline - มีค่าเป็น 1 และใช้เป็นเกณฑ์พื้นฐานสำหรับเปรียบเทียบค่า Lift
  • LiftValue - ค่า Lift สะสมของเปอร์เซ็นไทล์ ค่า Lift คืออัตราส่วนระหว่างความหนาแน่นของเรคคอร์ดที่เป็นบวกสะสมสำหรับข้อมูลที่เลือก เทียบกับความหนาแน่นที่เป็นบวกของข้อมูลทดสอบทั้งหมด
  • IdealModelLine - อัตราส่วนระหว่างจำนวนสะสมของเป้าหมายที่เป็นบวก เทียบกับจำนวนรวมของเป้าหมายที่เป็นบวก
  • OptimalGain - ค่านี้ระบุถึงจำนวนลูกค้าที่เหมาะสมที่สุดที่ต้องติดต่อ เส้นโค้งของค่า Gain สะสมจะแบนราบหลังจากจุดนี้ไป

จากนั้นคุณสามารถแสดงชุดข้อมูล <ชื่อโฟลว์ข้อมูล>_LIFT ในแผนภูมิของ Oracle Analytics ตัวอย่างเช่น ในการวิเคราะห์ค่า Gain คุณอาจพล็อตกราฟ PopulationPercentile บนแกน X และพล็อตกราฟ CumulativeGain, GainChartBaseline, IdealModelLine และ OptimalGain บนแกน Y

คำอธิบาย GUID-86078629-A9D9-44D2-8D91-8B5F2FD96DA3-default.png มีดังนี้
.png

สร้างข้อมูลเชิงคาดการณ์สำหรับแผนภูมิ Lift และ Gain

เมื่อคุณใช้โฟลว์ข้อมูลเพื่อใช้โมเดลการจัดประเภทกับชุดข้อมูล Oracle Analytics จะช่วยให้คุณสามารถคำนวณสถิติที่คุณสามารถแสดงข้อมูลในแผนภูมิการเพิ่มและกำไรได้

ก่อนที่จะเริ่มต้น ให้คุณสร้างโมเดลการจัดประเภทที่มีความเป็นไปได้ของการคาดการณ์ (เช่น โมเดลตัวจัดประเภทแบบหลายประเภทที่สร้างขึ้นโดยใช้สคริปต์การฝึกอบรมของ Naive Bayes) Oracle Analytics แสดงโมเดลที่ใช้ได้บนแท็บ โมเดล ในเพจ การเรียนรู้ของเครื่อง (จากเพจโฮม คลิก การเรียนรู้ของเครื่อง)
  1. ในเพจโฮม คลิก สร้าง แล้วคลิก โฟลว์ข้อมูล
  2. เลือกที่มาข้อมูล แล้วคลิก เพิ่ม
  3. คลิก เพิ่มขึ้นตอน แล้วเลือก ใช้โมเดล
  4. ที่ เลือกโมเดล ให้เลือกโมเดลการจัดประเภทที่มีความเป็นไปได้ของการคาดการณ์ จากนั้นคลิก ตกลง
  5. ใน ใช้โมเดล ในส่วน พารามิเตอร์ :
    • ใน คำนวณการเพิ่มและกำไร เลือก ใช่
    • ใน คอลัมน์เป้าหมายที่ต้องการคำนวณลิฟท์ เลือกชื่อคอลัมน์ของค่าที่จะคาดการณ์ ตัวอย่างเช่น หากโมเดลของคุณคาดการณ์ว่าลูกค้าจะลงทะเบียนสมาชิกโดยใช้คอลัมน์ชื่อ SIGNUP ให้เลือก SIGNUP
    • ใน คลาสค่าบวกที่จะคำนวณ ให้ระบุค่าข้อมูลที่ตรงตามตัวพิมพ์ใหญ่และเล็กซึ่งแสดงคลาสค่าบวก (หรือผลลัพธ์ที่ต้องการ) ในการคาดการณ์ ตัวอย่างเช่น หากโมเดลของคุณคำนวณว่าลูกค้าจะลงทะเบียนสมาชิกโดยใช้คอลัมน์ชื่อ SIGNUP ที่มีค่า YES หรือ NO ให้ระบุ YES
  6. เพิ่มโหนด บันทึกข้อมูล ในโฟลว์ข้อมูลของคุณ
  7. รันโฟลว์ข้อมูลนี้
โฟลว์ข้อมูลจะให้ชุดข้อมูลชื่อ <ชื่อโฟลว์ข้อมูล>_LIFT ที่มีสถิติการเพิ่มและกำไร ซึ่งคุณสามารถประมวลผลได้

ประมวลผลโมเดล Machine Learning โดยใช้แผนภูมิ Lift และ Gain

ใช้แผนภูมิเพื่อวิเคราะห์สถิติที่สร้างโดยโมเดลการจัดประเภทด้วย Machine Learning เพื่อระบุโมเดลที่ดีที่สุดที่จะใช้

ก่อนที่คุณจะเริ่ม ให้ใช้โมเดลการคาดการณ์และสร้างสถิติแบบ Lift และ Gain ในชุดข้อมูล
  1. บนโฮมเพจ ให้คลิก สร้าง แล้วคลิก เวิร์กบุค
  2. ใน เพิ่มชุดข้อมูล ให้เลือกชุดข้อมูล <ชื่อโฟลว์ข้อมูล>_LIFT ที่คุณสร้างไว้ในงานก่อนหน้านี้ แล้วคลิก เพิ่มไปยังเวิร์กบุค
  3. ในแผงข้อมูล แสดงข้อมูล ให้เลือกสถิติที่จะวิเคราะห์ แล้วคลิกขวาและเลือก เลือกการแสดงข้อมูล และเลือก แผนภูมิเส้น
    ตัวอย่างเช่น ในการวิเคราะห์ Gains คุณสามารถวาง PopulationPercentile บนแกน x และวางา CumulativeGain, GainChartBaseline, IdealModelLine และ OptimalGain บนแกน y
    ในการวิเคราะห์ Lift คุณสามารถวาง PopulationPercentile บนแกน x และวาง LiftChartBaseline และ LiftValue บนแกน y