Oracle Analitik öngörüye dayalı modelleri, veri kümelerinizde araştırma yapmak, bir hedef değeri tahmin etmek veya kayıtların sınıflarını belirlemek için bazı gömülü Oracle Makine Öğrenimi algoritmalarını kullanır. Öngörüye dayalı modeller oluşturmak, eğitmek ve verilerinize uygulamak için veri akışı düzenleyicisini kullanın.
Oracle Analitik öngörüye dayalı modeli; değerleri öngörmek, sınıfları öngörmek veya verideki grupları belirlemek için bir veri kümesine belirli bir algoritma uygular.
Verileri tahmin etmek için Oracle makine öğrenimi modellerini de kullanabilirsiniz.
Oracle Analitik, çeşitli amaçlarla öngörüye dayalı modelleri eğitmenize yardımcı olan algoritmalar içerir. Algoritmaya örnek olarak sınıflandırma ve regresyon ağaçları (CART), mantıksal regresyon ve k ortalamaları gösterilebilir.
Başta bir eğitim veri kümesinde model eğitmek için veri akışı düzenleyicisini kullanırsınız. Öngörüye dayalı model eğitildikten sonra, modeli öngörmek istediğiniz veri kümelerine uygularsınız.
Eğitilen bir modeli diğer kullanıcılara sunabilirsiniz ve onlar değerleri öngörmek için modeli verilerine göre uygulayabilir. Bazı durumlarda belirli kullanıcılar modelleri eğitir ve diğer kullanıcılar modelleri uygular.
Not:
Verilerinizde nelere bakmanız gerektiğinden emin değilseniz, eğilimleri ve düzenleri belirlemek için makine öğrenimini kullanan Explain Özelliğini kullanarak başlangıç yapabilirsiniz. Daha sonra veri akışı düzenleyicisini kullanarak, Explain özelliğinin bulduğu eğilimlerin ve düzenlerin detayına gitmek için öngörüye dayalı modeller oluşturabilir ve eğitebilirsiniz.Bir veri akışında veri kümesi oluşturmak veya bir çalışma kitabına öngörü görselleştirmesi eklemek üzere bilinmeyen veya etiketsiz verileri puanlamak için nihai modeli kullanın.
Örnek
Hangi hastaların yüksek kalp rahatsızlığına yakalanma riski olduğunu öngörmek için bir çoklu sınıflandırma modeli oluşturmak ve eğitmek istediğinizi varsayın.
Oracle Analitik makine öğrenimi modellemenizin ihtiyaç duyduklarına yönelik olarak algoritmalar sağlar: sayısal öngörü, çoklu sınıflandırıcı, ikili sınıflandırıcı ve kümeleme.
Oracle'ın makine öğrenimi fonksiyonu, verilerinde ne aradıkları hakkında fikir sahibi olan, öngörüye dayalı analiz uygulamalarını bilen ve algoritmalar arasındaki farkları anlayan gelişmiş veri analistlerine yöneliktir.
Not:
Oracle Otonom Veri Ambarı'ndan alınan verileri kullanıyorsanız, makine öğrenimi becerileri gerektirmeden sizin için tahmine dayalı bir modeli hızlı ve kolay bir şekilde eğitmek için AutoML özelliğini kullanabilirsiniz. Otonom Veri Ambarında AutoML Kullanarak Tahmine Dayalı Bir Model Eğitme konusuna bakın.Normalde kullanıcılar birden fazla öngörü modeli oluşturmak, modelleri karşılaştırmak ve ölçütleri ve gereksinimleri en iyi şekilde karşılayanı seçmek ister. Bu ölçütler farklılık gösterebilir. Örneğin, bazen kullanıcılar daha iyi genel doğruluğu olan modelleri seçerler, bazen kullanıcılar en az tip I (yanlış pozitif) ve tip II (yanlış negatif) hata içeren modelleri seçerler ve bazen kullanıcılar sonuçları daha hızlı döndüren ve sonuçlar ideal olmasa da kabul edilebilir bir doğruluk düzeyi olan modelleri seçerler.
Oracle Analitik, her tür öngörü veya sınıflandırmaya yönelik olarak birden fazla makine öğrenimi algoritması içerir. Bu algoritmalar ile, kullanıcılar birden fazla model oluşturabilir veya farklı ince ayarlı parametreleri kullanabilirler veya farklı girdi eğitim veri kümeleri kullanabilirler ve ardından en iyi modeli seçebilirler. Kullanıcı, kendi ölçütleri ile modelleri karşılaştırıp tartarak en iyi modeli seçebilir. En iyi modeli belirlemek üzere, kullanıcılar doğruluk belirlemek üzere modeli uygulayarak hesaplamaların sonuçlarını görselleştirebilirler veya Oracle Analitik tarafından çıktı oluşturmak üzere modeli kullandığı ilgili veri kümelerini açabilir ve keşfedebilirler.
Sağlanan algoritmalar hakkında bilgi edinmek için bu tabloya danışın.
Adı | Tür | Kategori | Fonksiyon | Açıklama |
---|---|---|---|---|
CART |
Sınıflandırma Regresyon |
İkili Sınıflandırıcı Çoklu Sınıflandırıcı Sayısal |
- | Hem ayrık hem de sürekli değerleri öngörmek için karar ağaçları kullanır.
Büyük veri kümeleri ile kullanın. |
Esnek Net Doğrusal Regresyon | Regresyon | Sayısal | ElasticNet | Gelişmiş regresyon modeli. Ek bilgiler sağlar (düzenleme), değişken seçimi gerçekleştirir ve doğrusal kombinasyonları gerçekleştirir. Lasso ve Ridge regresyon yöntemlerinin cezaları.
Doğrudaşlığı (birden fazla özelliğin kusursuz biçimde ilintili olduğu) ve aşırı uymayı engellemek üzere büyük sayıda özellik ile kullanın. |
Hiyerarşik | Kümeleme | Kümeleme | AgglomerativeClustering | Aşağıdan yukarı veya (her gözlem kendi kümesidir ve ardından birleştirilir) veya yukarıdan aşağı (tüm gözlemler tek küme olarak başlar) ve mesafe ölçümleri kullanarak bir kümeleme hiyerarşisi oluşturur.
Veri kümesi büyük olmadığında ve küme sayısı önceden bilinmediğinde kullanın. |
K-Ortalamaları | Kümeleme | Kümeleme | k-ortalamaları | Kayıtları tekrarlı olarak her gözlemin en yakın orta değerli kümeye ait olduğu k kümeye bölmelendirir.
Ölçüm sütunlarını kümeleme için ve gereken küme sayısının küme beklentisi ile kullanın. Büyük veri kümeleri ile başarıyla çalışır. Sonuçlar her çalıştırmada farklıdır. |
Doğrusal Regresyon | Regresyon | Sayısal | Sıradan En Küçük Kareler
Çıkıntı Lasso |
Hedef değişken ve veri kümesindeki diğer özellikler arasındaki ilişkiyi modellemek için doğrusal yaklaşım.
Özellikler kusursuz biçimde ilintili olmadığında sayısal değerleri öngörmek için kullanın. |
Lojistik Regresyon | Regresyon | İkili Sınıflandırıcı | LogisticRegressionCV | Kategorik olarak bağımlı bir değişkenin değerini öngörmek için kullanın. Bağımlı değişken, 1 veya 0 olarak kodlanmış veri içeren bir ikili değişkendir. |
Naive Bayes | Sınıflandırma |
İkili Sınıflandırıcı Çoklu Sınıflandırıcı |
GaussianNB | Özellikler arasında bağımlılık olmadığını varsayan Bayes teoremini esas alan olasılık sınıflandırması.
Yüksek sayıda girdi boyut olduğunda kullanın. |
Sinir Ağı | Sınıflandırma |
İkili Sınıflandırıcı Çoklu Sınıflandırıcı |
MLPClassifier | Sınıflandırma sonucunu fiili değer ile karşılaştırarak öğrenen ve daha fazla tekrarlama için algoritmayı değiştirmek üzere sonucu ağa döndüren tekrarlayan sınıflandırma algoritması.
Metin analizi için kullanın. |
Rastgele Orman | Sınıflandırma |
İkili Sınıflandırıcı Çoklu Sınıflandırıcı Sayısal |
- | Birden fazla karar ağacı oluşturan ve tüm karar ağaçlarını toplu olarak temsil eden değeri üreten bir topluluk öğrenim modeli.
Sayısal ve kategorik değişkenleri öngörmek için kullanın. |
Destek Vektör Makinesi | Sınıflandırma |
İkili Sınıflandırıcı Çoklu Sınıflandırıcı |
LinearSVC, SVC | Kayıtları, uzayda eşleyerek ve sınıflandırma için kullanılabilecek hiper düzlemler oluşturarak sınıflandırır. Yeni kayıtlar (puanlama verileri) uzaya eşlenir ve denk geldikleri hiper düzlemin kenarını esas alan bir kategoriye ait oldukları öngörülür. |
Oracle Otonom Veri Ambarı'ndan alınan verileri kullandığınızda, tahmine dayalı bir model önermek ve eğitmek için AutoML özelliğini kullanabilirsiniz. AutoML verilerinizi analiz eder, kullanılacak en iyi algoritmayı hesaplar ve verileriniz üzerinde tahminler yapabilmeniz için Oracle Analitik'te bir tahmin modeli kaydeder.
OML_Developer
rolüne sahip olduğundan ve bir "yönetici" süper kullanıcı olmadığından emin olun. Aksi takdirde, kaydetmeyi veya çalıştırmayı denediğinizde veri akışı başarısız olur.Geliş veri analistleri, veri kümelerinde araştırma yapmak, bir hedef değeri tahmin etmek veya kayıt sınıflarını belirlemek üzere Oracle Makine Öğrenimi algoritmalarını devreye almak için öngörüye dayalı modelleri oluşturur ve model eğitimlerini verir. Öngörüye dayalı modeller oluşturmak ve eğitmek ve verilerinize uygulamak için veri akışı düzenleyicisini kullanın.
Doğru model elde etmek tekrarlı bir süreçtir ve ileri düzey bir veri analisti farklı modelleri deneyebilir, bunların sonuçlarını karşılaştırabilir ve deneme yanılma yöntemiyle parametrelerde ince ayar yapabilir. Veri analisti, nihai doğru öngörüye dayalı modeli kullanarak diğer veri kümelerindeki eğilimleri öngörebilir veya modeli çalışma kitaplarına ekleyebilir.
Not:
Oracle Otonom Veri Ambarı'ndan alınan verileri kullanıyorsanız, makine öğrenimi becerileri gerektirmeden sizin için tahmine dayalı bir modeli hızlı ve kolay bir şekilde eğitmek için AutoML özelliğini kullanabilirsiniz. Bkz. Otonom Veri Ambarında AutoML Kullanarak Tahmine Dayalı Bir Model Eğitme.Oracle Analitik; sayısal öngörü, çoklu sınıflandırma, ikili sınıflandırma ve kümeleme için algoritmalar sağlar.
Oracle Analitik, veri akışlarındaki adımları kullanarak makine öğrenimi modellerini eğitmenize olanak tanır. Bir makine öğrenimi modeli eğittiğinizde, Modeli Uygula adımını kullanarak modeli verilerinize uygulayın.
Adım Adı | Açıklama |
---|---|
AutoML (Oracle Otonom Veri Ambarı gerektirir) | Sizin için öngörüye dayalı bir model önermesi ve bunu eğitmesi için Oracle Kendi Kendini Yöneten Veri Ambarı'nın AutoML özelliğini kullanın. AutoML adımı verilerinizi analiz eder, kullanılacak en iyi algoritmayı hesaplar ve öngörüye dayalı modeli Oracle Analitik'te kaydeder. |
İkili Sınıflandırıcı Eğitimi Verme |
Verilerinizi iki ön tanımlı kategoriden birinde sınıflandırmak için makine öğrenimi modeline eğitim verin. |
Kümeleme Eğitimi Verme | Benzer nitelikleri olan gruplara ayırmak ve bunları kümelere atamak için bir makine öğrenimi modeline eğitim verin. |
Birden Çok Sınıflandırıcı Eğitimi Verme | Verilerinizi üç veya daha fazla ön tanımlı kategoriye sınıflandırmak için makine öğrenimi modeline eğitim verin. |
Sayısal Öngörü Eğitimi Verme | Bilinen veri değerlerini esas alan bir sayısal değeri tahmin etmek için makine öğrenimi modeline eğitim verin. |
Öngörüye dayalı modeli oluşturup veri akışını çalıştırdıktan sonra, modelin doğruluğunu belirlemek için model hakkındaki bilgileri gözden geçirebilirsiniz. Doğruluğunu geliştirmek ve daha iyi sonuçlar öngörmek üzere modeli tekrarlı olarak düzenlemek için bu bilgileri kullanın.
Öngörüye dayalı modellerin detaylı bilgileri, modeli anlamanıza ve modelin verilerinizi öngörmek için uygun olup olmadığını belirlemenize yardımcı olur. Model detayları arasında model sınıfı, algoritma, girdi sütunları ve çıktı sütunları yer alır
Öngörüye dayalı bir modelin kalitesini anlamanıza yardımcı olan bilgileri görüntüleyin. Örneğin model doğruluğu, kesinlik, geri çağırma, F1 değeri ve hatalı pozitif oranı gibi doğruluk metriklerini gözden geçirebilirsiniz.
Oracle Analitik öngörüye dayalı modelinin eğitim modelini oluşturmak için veri akışını çalıştırdığınızda, Oracle Analitik ilgili veri kümelerinin bir grubunu oluşturur. Modelin doğruluğu hakkında bilgi edinmek için çalışma kitaplarını bu veri kümelerinde açabilir ve oluşturabilirsiniz.
Modeliniz için seçtiğiniz algoritmaya bağlı olarak, ilgili veri kümelerinde öngörü kuralları, doğruluk ölçümleri, karışıklık matrisi ve öngörü için temel etkenler gibi modele ilişkin detaylar yer alır. Daha iyi sonuçlar almak üzere modelde ince ayar yapmak için bu bilgileri kullanabilir ve modelleri karşılaştırmak üzere ilgili veri kümelerini kullanıp hangi modelin daha doğru olduğunu belirleyebilirsiniz.
Örneğin, hangi sütunların modelde güçlü bir pozitif veya negatif etkisi olduğunu öğrenmek için bir Sürücüler veri kümesi açabilirsiniz. Bu sütunları inceleyerek, gerçekçi girdiler olmadıklarından veya tahmin için çok ayrıntılı olduklarından model değişkenleri olarak değerlendirilmeyen sütunlar bulduğunuzu varsayın. Veri akışı düzenleyicisini kullanarak modeli açarsınız ve aldığınız bilgilere bağlı olarak alakasız veya çok ayrıntılı sütunları kaldırıp modeli yeniden oluşturursunuz. Kalite ve Sonuçlar sekmesini kontrol edip model doğruluğunun geliştiğini doğrularsınız. Modelin doğruluğundan memnun olana ve yeni bir veri kümesini puanlamaya hazır olana kadar bu işleme devam edersiniz.
Farklı algoritmalar benzer ilgili veri kümeleri oluşturur. Algoritma tipine bağlı olarak veri kümesinde ayrı parametreler ve sütun adları değişebilir, ancak veri kümesinin fonksiyonelliği değişmez. Örneğin bir istatistik veri kümesindeki sütun adları Doğrusal Regresyondan Mantıksal Regresyona değişebilir ancak istatistik veri kümesi, modelin doğruluk ölçümlerini içerir.
AutoML Modelleri İçin İlgili Veri Kümeleri
AutoML kullanarak öngörüye dayalı bir model eğittiğinizde, Oracle Analitik model hakkında yararlı bilgiler içeren ek veri kümeleri oluşturur. Oluşturulacak veri kümesi sayısı model algoritmasına göre değişiklik gösterir. Örneğin, Naive Bayes modelleri için Oracle Analitik koşullu olasılıklar hakkında bilgi sağlayan bir veri kümesi oluşturur. Karar ağacı modeli için veri kümesi karar ağacı istatistikleri hakkında bilgi sağlar. Genelleştirilmiş doğrusal model (GLM) algoritmasını kullanarak AutoML (otomatik makine öğrenimi) tarafından oluşturulan bir modeli denetlediğinizde, model hakkında meta veri bilgileri içeren modele özel veri kümeleri için girişler (GLM* ön ekine sahip) görürsünüz.
.png'' çiziminin açıklaması
İlgili Veri Kümeleri
Not:
Oracle Analitik, veri akışının çıktı adını ilgili veri kümesi tipine ekler. Örneğin, bir CART modeli için veri akışının çıktısı cart_model2 olarak adlandırılmışsa, veri kümesi cart_model2_CART olarak adlandırılır.CART
Oracle Analitik, CART (Sınıflandırma ve Regresyon Ağacı) ilgili veri kümesi için karar ağacındaki koşulları ve koşulların ölçütlerini temsil eden sütunlar, her grup için bir öngörü ve öngörü güvenirliğini içeren bir tablo oluşturur. Bu karar ağacını görselleştirmek için ağaç diyagramı görselleştirmesini kullanın.
Bu model ve algoritma kombinasyonlarını seçtiğinizde CART veri kümesi oluşturulur.
Model | Algoritma |
---|---|
Sayısal | Sayısal Öngörü İçin CART |
İkili Sınıflandırma | CART |
Çoklu Sınıflandırma | CART |
Sınıflandırma Raporu
Oracle Analitik, Classification Report ile ilgili veri kümesi için bir tablo oluşturur. Örneğin, hedef sütunda Evet veya Hayır olmak üzere iki ayrı değer olabilirse, bu veri kümesi hedef sütunun her ayrı değeri için F1, Kesinlik, Geri Çağırma ve Destek (eğitim veri kümesinde bu değeri içeren satır sayısı) gibi doğruluk metriklerini gösterir.
Bu model ve algoritma kombinasyonlarını seçtiğinizde Classification veri kümesi oluşturulur.
Model | Algoritmalar |
---|---|
İkili Sınıflandırma |
Naive Bayes Sinir Ağı Destek Vektör Makinesi |
Çoklu Sınıflandırma |
Naive Bayes Sinir Ağı Destek Vektör Makinesi |
Karışıklık Matrisi
Oracle Analitik, Confusion Matrix ile ilgili veri kümesi için bir özet tablo oluşturur ve bu tabloya hata matrisi de denir. Her satır, öngörülen bir sınıfın anını, her sütun ise fiili bir sınıfın anını temsil eder. Bu tabloda kesinlik, geri çağırma ve F1 doğruluk ölçümlerini hesaplamak için kullanılan hatalı pozitif, hatalı negatif, doğru pozitif ve doğru negatif sayısı raporlanır.
Bu model ve algoritma kombinasyonlarını seçtiğinizde Confusion Matrix veri kümesi oluşturulur.
Model | Algoritmalar |
---|---|
İkili Sınıflandırma |
Lojistik Regresyon CART (Karar Ağacı) Naive Bayes Sinir Ağı Rastgele Orman Destek Vektör Makinesi |
Çoklu Sınıflandırma |
CART (Karar Ağacı) Naive Bayes Sinir Ağı Rastgele Orman Destek Vektör Makinesi |
Sürücüler
Oracle Analitik, hedef sütun değerlerini belirleyen sütunlar hakkında bilgi içeren Drivers ile ilgili veri kümesi için bir tablo oluşturur. Bu sütunları tanımlamak için Doğrusal regresyonlar kullanılır. Her sütuna katsayı ve bağlantı değerleri atanır. Katsayı değeri, hedef sütunun değerini belirlemek için kullanılan sütun ağırlığını açıklar. Korelasyon değeri, hedef sütun ile bağımlı sütun arasındaki ilişki yönünü gösterir. Örneğin, hedef sütunun değerinin bağımlı sütuna göre artması veya azalması.
Bu model ve algoritma kombinasyonlarını seçtiğinizde Drivers veri kümesi oluşturulur.
Model | Algoritmalar |
---|---|
Sayısal |
Doğrusal Regresyon Esnek Net Doğrusal Regresyon |
İkili Sınıflandırma |
Lojistik Regresyon Destek Vektör Makinesi |
Çoklu Sınıflandırma | Destek Vektör Makinesi |
Hitmap
Oracle Analitik, Hitmap ile ilgili veri kümesi için bir tablo oluşturur ve karar ağacının alt düğümleri hakkında bilgi içerir. Tablodaki her satır bir yaprak düğümünü temsil eder ve segment boyutu, güvenilirlik ve beklenen satır sayısı gibi yaprak düğümün temsil ettiği unsurları açıklayan bilgiler içerir. Örneğin, beklenen doğru öngörü sayısı = Segment Boyutu * Güvenilirlik.
Bu model ve algoritma kombinasyonlarını seçtiğinizde Hitmap veri kümesi oluşturulur.
Model | Algoritma |
---|---|
Sayısal | Sayısal Öngörü İçin CART |
Artıklar
Oracle Analitik, Residuals ile ilgili veri kümesi için bir tablo oluşturur ve artık öngörülerin kalitesi hakkında bilgi içerir. Artık, bir regresyon modelinin ölçülen değeri ve öngörülen değeri arasındaki farktır. Bu veri kümesi, veri kümesindeki tüm sütunlar için fiili ve öngörülen değerler arasındaki mutlak farkın toplam değerini içerir.
Bu model ve algoritma kombinasyonlarını seçtiğinizde Residuals veri kümesi oluşturulur.
Model | Algoritmalar |
---|---|
Sayısal Değerler |
Doğrusal Regresyon Esnek Net Doğrusal Regresyon Sayısal Öngörü İçin CART |
İkili Sınıflandırma | CART (Karar Ağacı) |
Çoklu Sınıflandırma | CART (Karar Ağacı) |
İstatistikler
Oracle Analitik, Statistics ile ilgili veri kümesi için bir tablo oluşturur. Bu veri kümesinin ölçümleri, veri kümesini oluşturmak için kullanılan algoritmaya bağlıdır. Şu ölçüm listesini algoritmaya göre dikkate alın:
Bu model ve algoritma kombinasyonlarını seçtiğinizde bu veri kümesi oluşturulur.
Model | Algoritma |
---|---|
Sayısal |
Doğrusal Regresyon Esnek Net Doğrusal Regresyon Sayısal Öngörü İçin CART |
İkili Sınıflandırma |
Lojistik Regresyon CART (Karar Ağacı) Naive Bayes Sinir Ağı Rastgele Orman Destek Vektör Makinesi |
Çoklu Sınıflandırma |
Naive Bayes Sinir Ağı Rastgele Orman Destek Vektör Makinesi |
Özet
Oracle Analitik, Summary ilgili veri kümesi için bir tablo oluşturur ve Hedef adı ve Model adı gibi bilgiler içerir.
Bu model ve algoritma kombinasyonlarını seçtiğinizde Summary veri kümesi oluşturulur.
Model | Algoritmalar |
---|---|
İkili Sınıflandırma |
Naive Bayes Sinir Ağı Destek Vektör Makinesi |
Çoklu Sınıflandırma |
Naive Bayes Sinir Ağı Destek Vektör Makinesi |
İlgili veri kümeleri, öngörüye dayalı bir modeli eğitirken oluşturulur.
Bir çalışma kitabında senaryo oluştururken, modelin bulması için tasarlandığı eğilimleri ve desenleri göstermek için projenin veri kümesine öngörüye dayalı bir model uygularsınız.
Not:
Oracle makine öğrenimi modellerini çalışma kitabının verilerine uygulayamazsınız.