Oracle Analitik'te Benzerlik Analizi Gerçekleştirmeye Genel Bakış

Oracle Analitik'te, çeşitli vektör gömme modellerini kullanarak verilerinizde benzerlik analizi gerçekleştirebilirsiniz. Benzerlik analizi, tanımlanan ölçütlere veya metriklere göre iki veya daha fazla nesnenin, veri kümesinin, dokümanın veya düzenlerin ne kadar benzer olduğunu ölçmenize olanak tanır.

Örneğin, aşağıdaki gibi soruları yanıtlamak isteyebilirsiniz:
  • Hangi hastaların belirtilen bir hastaya benzer semptomları vardır?
  • Hangi müşterilerin belirli bir müşteriye benzer bir profili vardır?
  • Hangi sigorta talepleri belirli bir sigorta talebine benzer?

Nasıl çalışır?

Oracle Veritabanı V23ai veya daha ileri sürümler, vektörler arasındaki mesafeyi hesaplamak için vektör aramasını ve yapılandırılmış sorgulama dili (SQL) fonksiyonlarını destekler. Bu, veri kayıtları arasındaki benzerlik derecesini ölçmek için kullanılır. Oracle Analitik, veri kümelerinde benzerlik analizi yapmak için arka planda vektör araması kullanır.

Performans Değerlendirmeleri

Benzerlik analizi için işleme süresi şunlara bağlı olarak değişir:
  • Kaynak veri kümenizdeki satır sayısı.
  • Veri akışınızda kullanmak üzere seçtiğiniz sütun sayısı. Kaynak veri kümenizdeki tüm sütunların benzerlik analizi modelinizde kullanılmayacağını unutmayın. 10 ila 15 sütun kullanmanızı öneririz. 15'ten fazla sütun seçmek, modeli uygulamak için kullandığınız veri akışının performansını olumsuz yönde etkileyebilir.
  • Oracle Kendi Kendini Yöneten Yapay Zeka Göl Evi anınıza tahsis edilen Esnek Hesaplama Birimi (ECPU) sayısı.

Veri akışları, işlenebilecek veri miktarını belirleyen 2,5 saatlik bir zaman aşımı sınırına sahiptir.