Yükseltme ve Kazanç Grafiklerini Kullanarak Makine Öğrenimi Modellerini Değerlendirme

Yükseltme ve kazanç grafikleri, en doğru modeli belirlemek üzere farklı makine öğrenimi modellerini karşılaştırmanızı sağlar.

Yükseltme ve Kazanç Grafiklerini Kullanmaya Genel Bakış

Yükseltme ve kazanç grafikleri, Oracle Analitik içindeki bir görselleştirmede modelleme istatistiklerinin grafiklerini oluşturarak öngörüye dayalı makine öğrenimi modellerini değerlendirmenizi sağlar.

Bir sınıflandırma modelini bir veri kümesine uygulamak üzere bir veri akışı kullandığınızda, Oracle Analitik yükseltme ve kazanç değerlerini hesaplamanızı sağlar. Ardından, öngörüye dayalı modellerin doğruluğunu değerlendirmek ve kullanmak üzere en iyi olanı belirlemek için bu verileri bir grafikte görselleştirebilirsiniz.

GUID-BB91080A-9081-4AAD-8448-441240BDCEFE-default.png açıklaması aşağıdadır
.png'' çiziminin açıklaması

Ön Koşullar

  • Oracle Veritabanı veya Oracle Otonom Veri Ambarı
  • Tahmin olasılığını içeren bir sınıflandırma modeli (örneğin, Naive Bayes eğitim komut listesi kullanılarak oluşturulmuş bir çoklu sınıflandırıcı modeli).

    Mevcut öngörüye dayalı modellere, Oracle Analitik içindeki Makine Öğrenimi alanında erişirsiniz.

Kaldıraç ve Kar Analizi İçin İstatistikler Oluşturuldu

Bir veri kümesine öngörüye dayalı bir sınıflandırma modelini uyguladığınızda ve yükseltme ve kazanç istatistiklerini oluşturduğunuzda, bu sütunlar ile <Data flow name>_LIFT adlı bir veri kümesi oluşturursunuz.
  • PopulationPercentile - 100 eşit gruba bölünmüş veri kümesi popülasyonu.
  • CumulativeGain - O yüzde birliğe kadar olan pozitif hedeflerin kümülatif sayısının pozitif hedeflerin toplam sayısına göre oranı. Kümülatif kazanç çizgisi grafiğin sol üst köşesine ne kadar yakınsa kazanç bu oranda büyüktür; irtibat kurulan müşterilerin düşük oranı için ulaşılan yanıtlayanların oranı da bu oranda yüksektir.
  • GainChartBaseline - Genel yanıt oranı: çizgi, kayıtları rastgele seçersek beklediğimiz pozitif kayıt yüzdesini temsil eder. Örneğin, bir pazarlama kampanyasında müşterilerin %X kadarı ile rastgele iletişim sağlarsak toplam pozitif yanıtın %X kadarını alırız.
  • LiftChartBaseline - Değer 1'dir ve yükseltme karşılaştırma için bir referans değer olarak kullanılır.
  • LiftValue - Yüzde birlik için kümülatif yükseltme. Yükseltme, seçili veriler için kümülatif pozitif kayıt yoğunluğunun tüm test verisi üzerindeki pozitif yoğunluğuna oranıdır.
  • IdealModelLine - Pozitif hedeflerin kümülatif sayısının pozitif hedeflerin toplam sayısına oranı.
  • OptimalGain - İrtibat sağlanacak optimum müşteri sayısını gösterir. Kümülatif kazanç eğrisi bu noktanın ötesinde düzleşir.

<Data flow name>_LIFT veri kümesini bir Oracle Analitik grafiğinde görselleştirebilirsiniz. Örneğin, kazanç analizi için x eksenine PopulationPercentile ve y eksenine CumulativeGain, GainChartBaseline, IdealModelLine ve OptimalGain işaretleyebilirsiniz.

GUID-86078629-A9D9-44D2-8D91-8B5F2FD96DA3-default.png açıklaması aşağıdadır
.png'' çiziminin açıklaması

Yükseltme ve Kazanç Grafikleri İçin Öngörüye Dayalı Veri Oluşturma

Bir sınıflandırma modelini bir veri kümesine uygulamak üzere bir veri akışı kullandığınızda, Oracle Analitik yükseltme ve kazanç grafiklerinde görselleştirebileceğiniz istatistikleri hesaplamanızı sağlar.

Başlamadan önce tahmin olasılığını içeren bir sınıflandırma modeli oluşturun (örneğin, Naive Bayes eğitim komut listesi kullanılarak oluşturulmuş bir çoklu sınıflandırıcı modeli). Oracle Analitik, Makine Öğrenimi sayfasındaki Modeller sekmesinde mevcut modelleri görüntüler (Giriş sayfasından Makine Öğrenimi'ne tıklayın).
  1. Giriş sayfasında Oluştur'a ve ardından Veri Akışı'na tıklayın.
  2. Bir veri kaynağı seçin, ardından Ekle'ye tıklayın.
  3. Adım Ekle'ye tıklayın ve Model Uygula'yı seçin.
  4. Model Seç bölümünde öngörü olasılığını içeren bir sınıflandırma modeli seçin ve ardından Tamam'a tıklayın.
  5. Model Uygula'da, Parametreler bölümünde:
    • Yükseltme ve kazanç hesapla içinde, Evet'i seçin.
    • Yükseltme hesaplamaya yönelik hedef sütunda, tahmin yürütülen değerin sütun adını seçin. Örneğin, modeliniz müşterilerin SIGNUP adlı bir sütunu kullanarak bir üyelik için kayıt olacaklarını tahmin ediyorsa SIGNUP seçin.
    • Hesaplanacak pozitif sınıf içinde öngörüdeki pozitif sınıfı temsil eden büyük küçük harf duyarlı veri değerini (veya tercih edilen sonuç) belirtin. Örneğin, modeliniz müşterilerin SIGNUP adlı bir sütunu kullanarak EVET veya HAYIR değerleri ile bir üyelik için kayıt olacaklarını tahmin ediyorsa EVET belirtin.
  6. Veri akışınıza bir Veri Kaydetme düğümü ekleyin.
  7. Bu veri akışını yürütün.
Veri akışı değerlendirebileceğiniz yükseltme ve kazanç istatistiklerini içeren <Data flow name>_LIFT adlı bir veri kümesi oluşturur.

Yükseltme ve Kazanç Grafiği Kullanarak Makine Öğrenimi Modelini Değerlendirme

Kullanılacak en iyi modeli belirlemek için makine öğrenimi sınıflandırma modelleri tarafından oluşturulan istatistikleri analiz etmek üzere bir grafik kullanın.

Başlamadan önce verilerinize öngörüye dayalı bir model uygulayın ve bir veri kümesinde yükseltme ve kazanç istatistiklerini oluşturun.
  1. Giriş sayfasında Oluştur'a ve Çalışma Kitabı'na tıklayın.
  2. Veri Kümesi Ekle'de, önceki görevde oluşturduğunuz <Data flow name>_LIFT veri kümesini seçin, ardından Çalışma Kitabına Ekle'ye tıklayın.
  3. Görselleştir panelinde analiz edilecek istatistikleri seçin ardından sağ tıklayın ve Görselleştirme Seç ve Çizgi Grafik seçin.
    Örneğin, kazanç analizi için x eksenine PopulationPercentile yerleştirebilirsiniz ve y eksenine CumulativeGain, GainChartBaseline, IdealModelLine ve OptimalGain yerleştirebilirsiniz.
    Yükseltme analizi için e eksenine PopulationPercentile ve y eksenine LiftChartBaseline ve LiftValue yerleştirebilirsiniz.