Oracle Analitik Öngörüye Dayalı Modelleri Oluşturma ve Kullanma

Oracle Analitik öngörüye dayalı modelleri, veri kümelerinizde araştırma yapmak, bir hedef değeri tahmin etmek veya kayıtların sınıflarını belirlemek için bazı gömülü Oracle Makine Öğrenimi algoritmalarını kullanır. Öngörüye dayalı modeller oluşturmak, eğitmek ve verilerinize uygulamak için veri akışı düzenleyicisini kullanın.

Oracle Analitik Öngörüye Dayalı Modeller Nedir?

Oracle Analitik öngörüye dayalı modeli; değerleri öngörmek, sınıfları öngörmek veya verideki grupları belirlemek için bir veri kümesine belirli bir algoritma uygular.

Verileri tahmin etmek için Oracle makine öğrenimi modellerini de kullanabilirsiniz.

Oracle Analitik, çeşitli amaçlarla öngörüye dayalı modelleri eğitmenize yardımcı olan algoritmalar içerir. Algoritmaya örnek olarak sınıflandırma ve regresyon ağaçları (CART), mantıksal regresyon ve k ortalamaları gösterilebilir.

Başta bir eğitim veri kümesinde model eğitmek için veri akışı düzenleyicisini kullanırsınız. Öngörüye dayalı model eğitildikten sonra, modeli öngörmek istediğiniz veri kümelerine uygularsınız.

Eğitilen bir modeli diğer kullanıcılara sunabilirsiniz ve onlar değerleri öngörmek için modeli verilerine göre uygulayabilir. Bazı durumlarda belirli kullanıcılar modelleri eğitir ve diğer kullanıcılar modelleri uygular.

Not:

Verilerinizde nelere bakmanız gerektiğinden emin değilseniz, eğilimleri ve düzenleri belirlemek için makine öğrenimini kullanan Explain Özelliğini kullanarak başlangıç yapabilirsiniz. Daha sonra veri akışı düzenleyicisini kullanarak, Explain özelliğinin bulduğu eğilimlerin ve düzenlerin detayına gitmek için öngörüye dayalı modeller oluşturabilir ve eğitebilirsiniz.
Bir modeli eğitmek için veri akışı düzenleyicisini kullanırsınız:
  • Önce bir veri akışı oluşturur ve modeli eğitmek için kullanmak istediğiniz veri kümesini eklersiniz. Bu eğitim veri kümesinde, öngörmek istediğiniz veriler yer alır (örneğin satış veya yaş gibi bir değer ya da alacak riski işletim alanı gibi bir değişken).
  • Gerekirse sütun ekleyerek, sütun seçerek, birleştirerek vs. veri kümesini düzenlemek için veri akışı düzenleyicisini kullanabilirsiniz.
  • Verilerin modeli eğitmek istediğiniz veriler olduğunu teyit ettikten sonra veri akışına bir eğitim adımı ekler ve modeli eğitmek için bir sınıflandırma (ikili veya çoklu), regresyon veya küme algoritması seçersiniz. Daha sonra elde edilen modeli adlandırın, veri akışını kaydedin ve modeli eğitim oluşturmak için yeniden çalıştırın.
  • Modelin kalitesini belirlemek için makine öğrenimi nesnelerindeki nitelikleri inceleyin. Gerekirse, model istediğiniz kaliteye ulaşana kadar eğitim sürecini tekrarlayabilirsiniz.

Bir veri akışında veri kümesi oluşturmak veya bir çalışma kitabına öngörü görselleştirmesi eklemek üzere bilinmeyen veya etiketsiz verileri puanlamak için nihai modeli kullanın.

Örnek

Hangi hastaların yüksek kalp rahatsızlığına yakalanma riski olduğunu öngörmek için bir çoklu sınıflandırma modeli oluşturmak ve eğitmek istediğinizi varsayın.

  1. Ayrı hastalar hakkında yaş, cinsiyet ve göğüs arısı yaşama durumu gibi özellikler içeren bir eğitim veri kümesi ve kan basıncı, açlık kan şekeri, kolesterol ve maksimum kalp atış hızı gibi ölçümleri sağlayın. Eğitim veri kümesi ayrıca şu değerlerin birinin atandığı "Olasılık" adlı bir sütun içerir: Yok, düşük olasılık, orta olasılık, yüksek olasılık veya var.
  2. Öngörü için değer eklemeyen artık sütunları yoksaydığından ve sadece hedefi öngörüde bulunmaya yardımcı olan sütunları içerdiğinden CART (Karar Ağacı) algoritmasını kullanın. Algoritmayı veri akışına eklediğinizde, modeli eğitmek için Olasılık sütununu seçersiniz. Algoritma, öngörüleri ve ilgili veri kümelerini gerçekleştirmek ve çıkartmak için ihtiyacı olan sürücü sütunlarını seçmek üzere makine öğrenimini kullanır.
  3. Sonuçları inceleyin ve eğitim modelinde ince ayar yapın. Daha sonra hangi hastaların yüksek kalp rahatsızlığına sahip olma veya yakalanma olasılığı bulunduğunu öngörmek için modeli daha büyük bir veri kümesine uygulayın.

Öngörüye Dayalı Model Algoritmalarını Nasıl Seçerim?

Oracle Analitik makine öğrenimi modellemenizin ihtiyaç duyduklarına yönelik olarak algoritmalar sağlar: sayısal öngörü, çoklu sınıflandırıcı, ikili sınıflandırıcı ve kümeleme.

Oracle'ın makine öğrenimi fonksiyonu, verilerinde ne aradıkları hakkında fikir sahibi olan, öngörüye dayalı analiz uygulamalarını bilen ve algoritmalar arasındaki farkları anlayan gelişmiş veri analistlerine yöneliktir.

Not:

Oracle Otonom Veri Ambarı'ndan alınan verileri kullanıyorsanız, makine öğrenimi becerileri gerektirmeden sizin için tahmine dayalı bir modeli hızlı ve kolay bir şekilde eğitmek için AutoML özelliğini kullanabilirsiniz. Otonom Veri Ambarında AutoML Kullanarak Tahmine Dayalı Bir Model Eğitme konusuna bakın.

Normalde kullanıcılar birden fazla öngörü modeli oluşturmak, modelleri karşılaştırmak ve ölçütleri ve gereksinimleri en iyi şekilde karşılayanı seçmek ister. Bu ölçütler farklılık gösterebilir. Örneğin, bazen kullanıcılar daha iyi genel doğruluğu olan modelleri seçerler, bazen kullanıcılar en az tip I (yanlış pozitif) ve tip II (yanlış negatif) hata içeren modelleri seçerler ve bazen kullanıcılar sonuçları daha hızlı döndüren ve sonuçlar ideal olmasa da kabul edilebilir bir doğruluk düzeyi olan modelleri seçerler.

Oracle Analitik, her tür öngörü veya sınıflandırmaya yönelik olarak birden fazla makine öğrenimi algoritması içerir. Bu algoritmalar ile, kullanıcılar birden fazla model oluşturabilir veya farklı ince ayarlı parametreleri kullanabilirler veya farklı girdi eğitim veri kümeleri kullanabilirler ve ardından en iyi modeli seçebilirler. Kullanıcı, kendi ölçütleri ile modelleri karşılaştırıp tartarak en iyi modeli seçebilir. En iyi modeli belirlemek üzere, kullanıcılar doğruluk belirlemek üzere modeli uygulayarak hesaplamaların sonuçlarını görselleştirebilirler veya Oracle Analitik tarafından çıktı oluşturmak üzere modeli kullandığı ilgili veri kümelerini açabilir ve keşfedebilirler.

Sağlanan algoritmalar hakkında bilgi edinmek için bu tabloya danışın.

Adı Tür Kategori Fonksiyon Açıklama
CART

Sınıflandırma

Regresyon

İkili Sınıflandırıcı

Çoklu Sınıflandırıcı

Sayısal

- Hem ayrık hem de sürekli değerleri öngörmek için karar ağaçları kullanır.

Büyük veri kümeleri ile kullanın.

Esnek Net Doğrusal Regresyon Regresyon Sayısal ElasticNet Gelişmiş regresyon modeli. Ek bilgiler sağlar (düzenleme), değişken seçimi gerçekleştirir ve doğrusal kombinasyonları gerçekleştirir. Lasso ve Ridge regresyon yöntemlerinin cezaları.

Doğrudaşlığı (birden fazla özelliğin kusursuz biçimde ilintili olduğu) ve aşırı uymayı engellemek üzere büyük sayıda özellik ile kullanın.

Hiyerarşik Kümeleme Kümeleme AgglomerativeClustering Aşağıdan yukarı veya (her gözlem kendi kümesidir ve ardından birleştirilir) veya yukarıdan aşağı (tüm gözlemler tek küme olarak başlar) ve mesafe ölçümleri kullanarak bir kümeleme hiyerarşisi oluşturur.

Veri kümesi büyük olmadığında ve küme sayısı önceden bilinmediğinde kullanın.

K-Ortalamaları Kümeleme Kümeleme k-ortalamaları Kayıtları tekrarlı olarak her gözlemin en yakın orta değerli kümeye ait olduğu k kümeye bölmelendirir.

Ölçüm sütunlarını kümeleme için ve gereken küme sayısının küme beklentisi ile kullanın. Büyük veri kümeleri ile başarıyla çalışır. Sonuçlar her çalıştırmada farklıdır.

Doğrusal Regresyon Regresyon Sayısal Sıradan En Küçük Kareler

Çıkıntı

Lasso

Hedef değişken ve veri kümesindeki diğer özellikler arasındaki ilişkiyi modellemek için doğrusal yaklaşım.

Özellikler kusursuz biçimde ilintili olmadığında sayısal değerleri öngörmek için kullanın.

Lojistik Regresyon Regresyon İkili Sınıflandırıcı LogisticRegressionCV Kategorik olarak bağımlı bir değişkenin değerini öngörmek için kullanın. Bağımlı değişken, 1 veya 0 olarak kodlanmış veri içeren bir ikili değişkendir.
Naive Bayes Sınıflandırma

İkili Sınıflandırıcı

Çoklu Sınıflandırıcı

GaussianNB Özellikler arasında bağımlılık olmadığını varsayan Bayes teoremini esas alan olasılık sınıflandırması.

Yüksek sayıda girdi boyut olduğunda kullanın.

Sinir Ağı Sınıflandırma

İkili Sınıflandırıcı

Çoklu Sınıflandırıcı

MLPClassifier Sınıflandırma sonucunu fiili değer ile karşılaştırarak öğrenen ve daha fazla tekrarlama için algoritmayı değiştirmek üzere sonucu ağa döndüren tekrarlayan sınıflandırma algoritması.

Metin analizi için kullanın.

Rastgele Orman Sınıflandırma

İkili Sınıflandırıcı

Çoklu Sınıflandırıcı

Sayısal

- Birden fazla karar ağacı oluşturan ve tüm karar ağaçlarını toplu olarak temsil eden değeri üreten bir topluluk öğrenim modeli.

Sayısal ve kategorik değişkenleri öngörmek için kullanın.

Destek Vektör Makinesi Sınıflandırma

İkili Sınıflandırıcı

Çoklu Sınıflandırıcı

LinearSVC, SVC Kayıtları, uzayda eşleyerek ve sınıflandırma için kullanılabilecek hiper düzlemler oluşturarak sınıflandırır. Yeni kayıtlar (puanlama verileri) uzaya eşlenir ve denk geldikleri hiper düzlemin kenarını esas alan bir kategoriye ait oldukları öngörülür.

Oracle Otonom Veri Ambarında AutoML Kullanarak Tahmine Dayalı Bir Model Eğitme

Oracle Otonom Veri Ambarı'ndan alınan verileri kullandığınızda, tahmine dayalı bir model önermek ve eğitmek için AutoML özelliğini kullanabilirsiniz. AutoML verilerinizi analiz eder, kullanılacak en iyi algoritmayı hesaplar ve verileriniz üzerinde tahminler yapabilmeniz için Oracle Analitik'te bir tahmin modeli kaydeder.

AutoML'yi kullanmak, Oracle Otonom Veri Ambarı'nın tüm zor işi sizin için yapması anlamına gelir, böylece makine öğrenimi veya yapay zeka becerileri olmadan bir tahmin modeli dağıtabilirsiniz. Oluşturulan tahmin modeli, Makine Öğrenimi sayfasının Modeller alanına kaydedilir. Yeni modeli temel alarak verileri tahmin etmek için bir veri akışı oluşturun ve Modeli Uygula adımını kullanın.
Başlamadan önce:
  • Oracle Otonom Veri Ambarı'ndaki verileri temel alarak hakkında tahminde bulunmak istediğiniz bir veri kümesi oluşturun. Örneğin, azalma için 'Evet' veya 'Hayır' ifadesini gösteren ATTRITION adlı bir alan da dahil olmak üzere, çalışan azalması hakkında verileriniz olabilir.
  • Oracle Otonom Veri Ambarı ile Oracle Analitik bağlantısında belirtilen veritabanı kullanıcısının OML_Developer rolüne sahip olduğundan ve bir "yönetici" süper kullanıcı olmadığından emin olun. Aksi takdirde, kaydetmeyi veya çalıştırmayı denediğinizde veri akışı başarısız olur.
  1. Giriş sayfasında Oluştur'a ve ardından Veri Akışı'na tıklayın.
  2. Veri Kümesi Ekle'de, analiz edilecek verileri içeren Oracle Otonom Veri Ambarı'na dayalı veri kümesini seçin.
  3. Adım ekle'ye ve ardından AutoML'ye tıklayın.
  4. Hedef için Sütun seç'e tıklayın ve tahmin etmeye çalıştığınız değeri içeren veri sütununu seçin.
    Örneğin, çalışan azalmasını tahmin etmek için, çalışanların bir kuruluştan ayrılıp ayrılmadığını 'DOĞRU' veya 'YANLIŞ' olarak belirten ATTRITION adlı bir alan seçebilirsiniz.

  5. Oracle Analitik'in önerdiği Görev Tipi ve Model Sıralama Metriği'ni kabul edin veya farklı bir algoritma seçin.
  6. Modeli Kaydet'e tıklayın ve oluşturulan tahmin modelinin adını belirtin.
  7. Kaydet'e tıklayın ve veri akışı için bir ad belirtin.
  8. Verileri analiz etmek ve tahmine dayalı bir model oluşturmak için Çalıştır'a tıklayın.
  9. Ana sayfadan, Gezin'e tıklayın, ardından Makine Öğrenimi'ne tıklayın, ardından oluşturulan modele sağ tıklayın ve Denetle'yi seçin.
Oracle Analitik'in oluşturduğu modeli Modeller sekmesindeki Makine Öğrenimi sayfasında bulabilirsiniz. Kalitesini değerlendirmek için modeli denetleyin. Öngörüye Dayalı Modelin Kalitesini Değerlendirme konusuna bakın. AutoML tarafından oluşturulmuş modeller için oluşturulan ilgili veri kümelerine de bakabilirsiniz. Öngörüye Dayalı Modelin İlgili Veri Kümeleri Nelerdir? konusuna bakın.

Öngörüye Dayalı Model Oluşturma ve Eğitme

Geliş veri analistleri, veri kümelerinde araştırma yapmak, bir hedef değeri tahmin etmek veya kayıt sınıflarını belirlemek üzere Oracle Makine Öğrenimi algoritmalarını devreye almak için öngörüye dayalı modelleri oluşturur ve model eğitimlerini verir. Öngörüye dayalı modeller oluşturmak ve eğitmek ve verilerinize uygulamak için veri akışı düzenleyicisini kullanın.

Eğitim Programı simgesi LiveLabs Sprint

Doğru model elde etmek tekrarlı bir süreçtir ve ileri düzey bir veri analisti farklı modelleri deneyebilir, bunların sonuçlarını karşılaştırabilir ve deneme yanılma yöntemiyle parametrelerde ince ayar yapabilir. Veri analisti, nihai doğru öngörüye dayalı modeli kullanarak diğer veri kümelerindeki eğilimleri öngörebilir veya modeli çalışma kitaplarına ekleyebilir.

Not:

Oracle Otonom Veri Ambarı'ndan alınan verileri kullanıyorsanız, makine öğrenimi becerileri gerektirmeden sizin için tahmine dayalı bir modeli hızlı ve kolay bir şekilde eğitmek için AutoML özelliğini kullanabilirsiniz. Bkz. Otonom Veri Ambarında AutoML Kullanarak Tahmine Dayalı Bir Model Eğitme.

Oracle Analitik; sayısal öngörü, çoklu sınıflandırma, ikili sınıflandırma ve kümeleme için algoritmalar sağlar.

  1. Giriş sayfasında Oluştur'a tıklayın ve Veri Akışı'nı seçin.
  2. Modeli eğitmek için kullanmak istediğiniz veri kümesini seçin. Ekle'ye tıklayın.
  3. Veri akışı düzenleyicisinde Adım ekle (+) öğesini seçin.
    Bir veri kümesi ekledikten sonra modeli oluşturmak için veri kümesindeki tüm sütunları kullanabilir veya sadece ilgili sütunları seçebilirsiniz. İlgili sütunların seçilmesi için veri kümesinin anlaşılması gerekir. Sonuçta ortaya çıkacak davranışı etkilemeyeceğini bildiğiniz sütunları veya artık bilgiler içeren sütunları yoksayın. Sütun Seç adımını ekleyerek sadece ilgili sütunları seçebilirsiniz. İlgili sütunlardan emin değilseniz tüm sütunları kullanın.
  4. Model eğitimi adımlarından birini seçin (örneğin, Sayısal Öngörü Eğitimi veya Kümeleme Eğitimi).
  5. Bir algoritma seçin ve Tamam'a tıklayın.
  6. Öngörü veya sınıflandırma gibi denetlenen bir modelle çalışıyorsanız Hedef'e tıklayın ve öngörmeye çalıştığınız sütunu seçin. Örneğin, bir kişinin gelirini öngörmek için bir model oluşturuyorsanız Gelir sütununu seçin.
    Kümeleme gibi denetlenmeyen bir modelle çalışıyorsanız hedef sütun gerekli değildir.
  7. Öngörülen sonucun doğruluğunu ayarlamak ve geliştirmek için modelinizin ayar öndeğerlerini değiştirin. Bu ayarları çalıştığınız model belirler.
  8. Modeli Kaydet adımına tıklayın ve bir ad ve açıklama sağlayın.
  9. Kaydet'e tıklayın, veri akışı için bir ad ile açıklama girin ve Tamam'a tıklayıp veri akışını kaydedin.
  10. Sağladığınız girdi veri kümesi ve model ayarlarına göre öngörüye dayalı modeli oluşturmak için Veri Akışını Çalıştır'a tıklayın.

Makine Öğrenimi Modellerini Eğitmek İçin Veri Akışı Adımları

Oracle Analitik, veri akışlarındaki adımları kullanarak makine öğrenimi modellerini eğitmenize olanak tanır. Bir makine öğrenimi modeli eğittiğinizde, Modeli Uygula adımını kullanarak modeli verilerinize uygulayın.

Adım Adı Açıklama
AutoML (Oracle Otonom Veri Ambarı gerektirir) Sizin için öngörüye dayalı bir model önermesi ve bunu eğitmesi için Oracle Kendi Kendini Yöneten Veri Ambarı'nın AutoML özelliğini kullanın. AutoML adımı verilerinizi analiz eder, kullanılacak en iyi algoritmayı hesaplar ve öngörüye dayalı modeli Oracle Analitik'te kaydeder.
İkili Sınıflandırıcı Eğitimi Verme

Verilerinizi iki ön tanımlı kategoriden birinde sınıflandırmak için makine öğrenimi modeline eğitim verin.

Kümeleme Eğitimi Verme Benzer nitelikleri olan gruplara ayırmak ve bunları kümelere atamak için bir makine öğrenimi modeline eğitim verin.
Birden Çok Sınıflandırıcı Eğitimi Verme Verilerinizi üç veya daha fazla ön tanımlı kategoriye sınıflandırmak için makine öğrenimi modeline eğitim verin.
Sayısal Öngörü Eğitimi Verme Bilinen veri değerlerini esas alan bir sayısal değeri tahmin etmek için makine öğrenimi modeline eğitim verin.

Öngörüye Dayalı Modelleri Denetleme

Öngörüye dayalı modeli oluşturup veri akışını çalıştırdıktan sonra, modelin doğruluğunu belirlemek için model hakkındaki bilgileri gözden geçirebilirsiniz. Doğruluğunu geliştirmek ve daha iyi sonuçlar öngörmek üzere modeli tekrarlı olarak düzenlemek için bu bilgileri kullanın.

Öngörüye Dayalı Modellerin Detaylarını Görüntüleme

Öngörüye dayalı modellerin detaylı bilgileri, modeli anlamanıza ve modelin verilerinizi öngörmek için uygun olup olmadığını belirlemenize yardımcı olur. Model detayları arasında model sınıfı, algoritma, girdi sütunları ve çıktı sütunları yer alır

  1. Giriş sayfasında Gezgin'e ve ardından Makine Öğrenimi'ne tıklayın.
  2. Bir eğitim modelinin menü simgesine tıklayın ve Denetle'yi seçin.
  3. Modelin bilgilerini görüntülemek için Detaylar'a tıklayın.

Öngörüye Dayalı Modelin Kalitesini Değerlendirme

Öngörüye dayalı bir modelin kalitesini anlamanıza yardımcı olan bilgileri görüntüleyin. Örneğin model doğruluğu, kesinlik, geri çağırma, F1 değeri ve hatalı pozitif oranı gibi doğruluk metriklerini gözden geçirebilirsiniz.

Oracle Analitik, modeli oluşturmak için kullanılan algoritmadan bağımsız olarak benzer ölçümler sağlayarak farklı modeller arasında karşılaştırma yapmayı kolaylaştırır. Model oluşturma sürecinde, modeli Eğitim Bölümlendirme Yüzdesi parametresine göre eğitmek ve test etmek için girilen veri kümesi iki parçaya ayrılır. Model, oluşturulan modelin doğruluğunu test etmek için veri kümesinin test bölümünü kullanır.
Kalite sekmesindeki verilere göre model parametrelerini ayarlamanız ve saklamanız gerekebilir.
  1. Giriş sayfasında Gezgin'e ve ardından Makine Öğrenimi'ne tıklayın.
  2. Bir eğitim modelinin menü simgesine tıklayın ve Denetle'yi seçin.
  3. Modelin kalite metriklerini gözden geçirmek ve modeli değerlendirmek için Kalite sekmesine tıklayın. Örneğin, Model Doğruluğu puanını gözden geçirin.

İpucu: Model için oluşturulan görünümlerin detaylarını gözden geçirmek için Diğer'e tıklayın.

Öngörüye Dayalı Modelin İlgili Veri Kümeleri Nelerdir?

Oracle Analitik öngörüye dayalı modelinin eğitim modelini oluşturmak için veri akışını çalıştırdığınızda, Oracle Analitik ilgili veri kümelerinin bir grubunu oluşturur. Modelin doğruluğu hakkında bilgi edinmek için çalışma kitaplarını bu veri kümelerinde açabilir ve oluşturabilirsiniz.

Modeliniz için seçtiğiniz algoritmaya bağlı olarak, ilgili veri kümelerinde öngörü kuralları, doğruluk ölçümleri, karışıklık matrisi ve öngörü için temel etkenler gibi modele ilişkin detaylar yer alır. Daha iyi sonuçlar almak üzere modelde ince ayar yapmak için bu bilgileri kullanabilir ve modelleri karşılaştırmak üzere ilgili veri kümelerini kullanıp hangi modelin daha doğru olduğunu belirleyebilirsiniz.

Örneğin, hangi sütunların modelde güçlü bir pozitif veya negatif etkisi olduğunu öğrenmek için bir Sürücüler veri kümesi açabilirsiniz. Bu sütunları inceleyerek, gerçekçi girdiler olmadıklarından veya tahmin için çok ayrıntılı olduklarından model değişkenleri olarak değerlendirilmeyen sütunlar bulduğunuzu varsayın. Veri akışı düzenleyicisini kullanarak modeli açarsınız ve aldığınız bilgilere bağlı olarak alakasız veya çok ayrıntılı sütunları kaldırıp modeli yeniden oluşturursunuz. Kalite ve Sonuçlar sekmesini kontrol edip model doğruluğunun geliştiğini doğrularsınız. Modelin doğruluğundan memnun olana ve yeni bir veri kümesini puanlamaya hazır olana kadar bu işleme devam edersiniz.

Farklı algoritmalar benzer ilgili veri kümeleri oluşturur. Algoritma tipine bağlı olarak veri kümesinde ayrı parametreler ve sütun adları değişebilir, ancak veri kümesinin fonksiyonelliği değişmez. Örneğin bir istatistik veri kümesindeki sütun adları Doğrusal Regresyondan Mantıksal Regresyona değişebilir ancak istatistik veri kümesi, modelin doğruluk ölçümlerini içerir.

AutoML Modelleri İçin İlgili Veri Kümeleri

AutoML kullanarak öngörüye dayalı bir model eğittiğinizde, Oracle Analitik model hakkında yararlı bilgiler içeren ek veri kümeleri oluşturur. Oluşturulacak veri kümesi sayısı model algoritmasına göre değişiklik gösterir. Örneğin, Naive Bayes modelleri için Oracle Analitik koşullu olasılıklar hakkında bilgi sağlayan bir veri kümesi oluşturur. Karar ağacı modeli için veri kümesi karar ağacı istatistikleri hakkında bilgi sağlar. Genelleştirilmiş doğrusal model (GLM) algoritmasını kullanarak AutoML (otomatik makine öğrenimi) tarafından oluşturulan bir modeli denetlediğinizde, model hakkında meta veri bilgileri içeren modele özel veri kümeleri için girişler (GLM* ön ekine sahip) görürsünüz.
GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png açıklaması aşağıdadır
.png'' çiziminin açıklaması

İlgili Veri Kümeleri

Not:

Oracle Analitik, veri akışının çıktı adını ilgili veri kümesi tipine ekler. Örneğin, bir CART modeli için veri akışının çıktısı cart_model2 olarak adlandırılmışsa, veri kümesi cart_model2_CART olarak adlandırılır.

CART

Oracle Analitik, CART (Sınıflandırma ve Regresyon Ağacı) ilgili veri kümesi için karar ağacındaki koşulları ve koşulların ölçütlerini temsil eden sütunlar, her grup için bir öngörü ve öngörü güvenirliğini içeren bir tablo oluşturur. Bu karar ağacını görselleştirmek için ağaç diyagramı görselleştirmesini kullanın.

Bu model ve algoritma kombinasyonlarını seçtiğinizde CART veri kümesi oluşturulur.

Model Algoritma
Sayısal Sayısal Öngörü İçin CART
İkili Sınıflandırma CART
Çoklu Sınıflandırma CART

Sınıflandırma Raporu

Oracle Analitik, Classification Report ile ilgili veri kümesi için bir tablo oluşturur. Örneğin, hedef sütunda Evet veya Hayır olmak üzere iki ayrı değer olabilirse, bu veri kümesi hedef sütunun her ayrı değeri için F1, Kesinlik, Geri Çağırma ve Destek (eğitim veri kümesinde bu değeri içeren satır sayısı) gibi doğruluk metriklerini gösterir.

Bu model ve algoritma kombinasyonlarını seçtiğinizde Classification veri kümesi oluşturulur.

Model Algoritmalar
İkili Sınıflandırma

Naive Bayes

Sinir Ağı

Destek Vektör Makinesi

Çoklu Sınıflandırma

Naive Bayes

Sinir Ağı

Destek Vektör Makinesi

Karışıklık Matrisi

Oracle Analitik, Confusion Matrix ile ilgili veri kümesi için bir özet tablo oluşturur ve bu tabloya hata matrisi de denir. Her satır, öngörülen bir sınıfın anını, her sütun ise fiili bir sınıfın anını temsil eder. Bu tabloda kesinlik, geri çağırma ve F1 doğruluk ölçümlerini hesaplamak için kullanılan hatalı pozitif, hatalı negatif, doğru pozitif ve doğru negatif sayısı raporlanır.

Bu model ve algoritma kombinasyonlarını seçtiğinizde Confusion Matrix veri kümesi oluşturulur.

Model Algoritmalar
İkili Sınıflandırma

Lojistik Regresyon

CART (Karar Ağacı)

Naive Bayes

Sinir Ağı

Rastgele Orman

Destek Vektör Makinesi

Çoklu Sınıflandırma

CART (Karar Ağacı)

Naive Bayes

Sinir Ağı

Rastgele Orman

Destek Vektör Makinesi

Sürücüler

Oracle Analitik, hedef sütun değerlerini belirleyen sütunlar hakkında bilgi içeren Drivers ile ilgili veri kümesi için bir tablo oluşturur. Bu sütunları tanımlamak için Doğrusal regresyonlar kullanılır. Her sütuna katsayı ve bağlantı değerleri atanır. Katsayı değeri, hedef sütunun değerini belirlemek için kullanılan sütun ağırlığını açıklar. Korelasyon değeri, hedef sütun ile bağımlı sütun arasındaki ilişki yönünü gösterir. Örneğin, hedef sütunun değerinin bağımlı sütuna göre artması veya azalması.

Bu model ve algoritma kombinasyonlarını seçtiğinizde Drivers veri kümesi oluşturulur.

Model Algoritmalar
Sayısal

Doğrusal Regresyon

Esnek Net Doğrusal Regresyon

İkili Sınıflandırma

Lojistik Regresyon

Destek Vektör Makinesi

Çoklu Sınıflandırma Destek Vektör Makinesi

Hitmap

Oracle Analitik, Hitmap ile ilgili veri kümesi için bir tablo oluşturur ve karar ağacının alt düğümleri hakkında bilgi içerir. Tablodaki her satır bir yaprak düğümünü temsil eder ve segment boyutu, güvenilirlik ve beklenen satır sayısı gibi yaprak düğümün temsil ettiği unsurları açıklayan bilgiler içerir. Örneğin, beklenen doğru öngörü sayısı = Segment Boyutu * Güvenilirlik.

Bu model ve algoritma kombinasyonlarını seçtiğinizde Hitmap veri kümesi oluşturulur.

Model Algoritma
Sayısal Sayısal Öngörü İçin CART

Artıklar

Oracle Analitik, Residuals ile ilgili veri kümesi için bir tablo oluşturur ve artık öngörülerin kalitesi hakkında bilgi içerir. Artık, bir regresyon modelinin ölçülen değeri ve öngörülen değeri arasındaki farktır. Bu veri kümesi, veri kümesindeki tüm sütunlar için fiili ve öngörülen değerler arasındaki mutlak farkın toplam değerini içerir.

Bu model ve algoritma kombinasyonlarını seçtiğinizde Residuals veri kümesi oluşturulur.

Model Algoritmalar
Sayısal Değerler

Doğrusal Regresyon

Esnek Net Doğrusal Regresyon

Sayısal Öngörü İçin CART

İkili Sınıflandırma CART (Karar Ağacı)
Çoklu Sınıflandırma CART (Karar Ağacı)

İstatistikler

Oracle Analitik, Statistics ile ilgili veri kümesi için bir tablo oluşturur. Bu veri kümesinin ölçümleri, veri kümesini oluşturmak için kullanılan algoritmaya bağlıdır. Şu ölçüm listesini algoritmaya göre dikkate alın:

  • Doğrusal Regresyon, Sayısal Öngörü için CART, Esnek Net Doğrusal Regresyon - Bu algoritmalar, R Kare, Düzeltilmiş R Kare, Ortalama Mutlak Hata (MAE), Ortalama Karekök Hatası (MSE), Göreli Mutlak Hata (RAE), Göreli Karekök Hatası (RSE), Karekök Ortalama Hatası (RMSE).
  • CART (Sınıflandırma ve Regresyon Ağaçları), Naive Bayes Sınıflandırma, Sinir Ağı, Destek Vektör Makinesi (SVM), Rastgele Orman, Mantıksal Regresyon - Bu algoritmalar şunları içerir: Doğruluk, Toplam F1.

Bu model ve algoritma kombinasyonlarını seçtiğinizde bu veri kümesi oluşturulur.

Model Algoritma
Sayısal

Doğrusal Regresyon

Esnek Net Doğrusal Regresyon

Sayısal Öngörü İçin CART

İkili Sınıflandırma

Lojistik Regresyon

CART (Karar Ağacı)

Naive Bayes

Sinir Ağı

Rastgele Orman

Destek Vektör Makinesi

Çoklu Sınıflandırma

Naive Bayes

Sinir Ağı

Rastgele Orman

Destek Vektör Makinesi

Özet

Oracle Analitik, Summary ilgili veri kümesi için bir tablo oluşturur ve Hedef adı ve Model adı gibi bilgiler içerir.

Bu model ve algoritma kombinasyonlarını seçtiğinizde Summary veri kümesi oluşturulur.

Model Algoritmalar
İkili Sınıflandırma

Naive Bayes

Sinir Ağı

Destek Vektör Makinesi

Çoklu Sınıflandırma

Naive Bayes

Sinir Ağı

Destek Vektör Makinesi

Öngörüye Dayalı Modelin İlgili Veri Kümelerini Bulma

İlgili veri kümeleri, öngörüye dayalı bir modeli eğitirken oluşturulur.

Algoritmaya bağlı olarak ilgili veri kümeleri model hakkında şu gibi detayları içerebilir: Öngörü kuralları, doğruluk ölçümleri, karışıklık matrisi, öngörü için temel etkenler vb. Bu parametreler, modelin öngörüleri ve sınıflandırmaları belirlemek için kullandığı kuralları anlamanıza yardımcı olur.
  1. Giriş sayfasında Gezgin'e ve ardından Makine Öğrenimi'ne tıklayın.
  2. Bir eğitim modelinin menü simgesine tıklayın ve Denetle'yi seçin.
  3. Modelin ilgili veri kümelerin erişmek için İlgili sekmesine tıklayın.
  4. Bir ilgili veri kümesine çift tıklayarak onu görüntüleyin veya bir çalışma kitabında kullanın.

Çalışma Kitabına Öngörüye Dayalı Model Ekleme

Bir çalışma kitabında senaryo oluştururken, modelin bulması için tasarlandığı eğilimleri ve desenleri göstermek için projenin veri kümesine öngörüye dayalı bir model uygularsınız.

Not:

Oracle makine öğrenimi modellerini çalışma kitabının verilerine uygulayamazsınız.
Modeli çalışma kitabına ekleyip modelin girdilerini veri kümesinin sütunlarına eşledikten sonra, Veri bölmesinde modelin nesneleri yer alır ve bunları fona sürükleyebilirsiniz. Makine öğrenimi, görselleştirmenin ilgili veri sütunlarına göre modelin değerlerini oluşturur.
  1. Giriş sayfasında Oluştur'a ve Çalışma Kitabı'na tıklayın.
  2. Çalışma kitabını oluşturmak için kullanmak istediğiniz veri kümesini seçin ve Çalışma Kitabına Ekle'ye tıklayın.
  3. Veri bölmesinde Ekle'ye tıklayın ve Senaryo Oluştur'u seçin.
  4. Senaryo Oluştur - Model Seç iletişim kutusunda bir model seçin ve Tamam'a tıklayın.
    Sadece öngörüye dayalı modelleri uygulayabilirsiniz. Oracle makine öğrenimi modellerini uygulayamazsınız.
    Her bir model girdisi bir veri öğesiyle eşleştirilemezse, Verilerinizi Modele Eşleyin iletişim kutusu görüntülenir.
  5. Verileri Modele Eşleyin iletişim kutusu görüntülenirse, Veri Kümesi alanında modelle birlikte kullanılacak veri kümesini seçin.
  6. Model girdisi ile veri öğelerini gerektiği gibi eşleştirin. Bitti'ye tıklayın.
    Senaryo, Veri Öğeleri bölmesinde bir veri kümesi olarak görüntülenir.
  7. Veri kümesi ve modeldeki öğeleri Görselleştir fonuna sürükleyin.
  8. Senaryoyu ayarlamak için Veri Öğeleri bölmesinde senaryoya sağ tıklayıp Senaryoyu Düzenle'yi seçin.
  9. Gerekirse veri kümesini değiştirin ve model girdisi ile veri öğeleri eşlemesini güncelleyin.
  10. Çalışma kitabını kaydetmek için Kaydet'e tıklayın.