Veri Profili Oluşturma ve Semantik Önerileri

Bir veri kümesi oluşturduğunuzda, veri kümesi verilerinizi onarmak veya zenginleştirmek amacıyla bir grup semantik önerisi üretmek için Oracle Analitik sütun düzeyi profil oluşturma gerçekleştirir. Çalışma kitapları oluşturduğunuzda, görselleştirmelerinize Veri Panelinden bilgi zenginleştirmelerini de ekleyebilirsiniz.

Not:

Bilgi zenginleştirmeleri genellikle öndeğer olarak etkindir ancak çalışma kitabı düzenleyicileri, sahip oldukları veri kümeleri veya düzenleme yetkilerine sahip oldukları veri kümeleri için bunları etkinleştirebilir veya devre dışı bırakabilir. Oracle Analitik, bir veri akışından oluşturulan veri kümeleri için otomatik olarak zenginleştirme önerileri sağlamaz. Bu durumda, veri kümesi sahibi veya yöneticisi önce veri kümesi için bilgi zenginleştirmeleri seçeneğini etkinleştirmelidir. Veri Kümeleri İçin Bilgi Zenginleştirmelerini Etkinleştirme konusuna bakın.

Bu öneriler, sistemin profil oluşturma adımı sırasında belirli bir semantik türünü otomatik olarak algılamasına bağlıdır. Örneğin, yerel konu alanlarını esas alan veri kümelerinin profilleri basit bir En Üst N numunesi kullanılarak oluşturulur.

Şehir adlarıyla tanımlanan coğrafi konumlar, kredi kartlarında, e-posta adreslerinde ve sosyal sigorta numaralarında olduğu gibi tanınabilir örüntüler, tarihler ve yinelenen örüntüler gibi anlamsal tiplerden oluşan kategorileri vardır. Kendi özel anlam tiplerinizi de oluşturabilirsiniz.

Semantik Türü Kategorileri

Profil oluşturma çeşitli semantik türlerine uygulanır.

Şunları tanımlamak için semantik türü kategorilerinin profili oluşturulur:

  • Şehir adları gibi coğrafi konumlar.
  • Kredi kartı numaraları veya e-posta adreslerinde bulunanlar gibi düzenler.
  • Tireli sözcük grubu verisi gibi yinelenen düzenler.

Semantik Türü Önerileri

Veri kümesini onarma, iyileştirme veya zenginleştirme önerileri verilerin tipine göre belirlenir.

Semantik tür önerilerine örnekler:

  • Geliştirmeler - Coğrafi konum gibi belirli bir algılanan türle ilgili verinize yeni bir sütun ekleme. Örneğin, bir şehir için nüfus verileri ekleme.
  • Sütun Bitiştirme - Veri kümesinde biri adları ve diğeri soyadları içeren iki sütun algılandığında, sistem adların tek sütunda bitiştirilmesini önerir. Örneğin, a first_name_last_name sütunu.
  • Semantik Çıkartmaları - Bir semantik türü, alan kodu içeren bir us_phone numarası gibi alt türlerden oluştuğunda, sistem alan kodunun kendi sütununa çıkartılmasını önerir.
  • Bölüm Çıkartma - Veride genel bir düzen ayırıcısı algılandığında, sistem o düzenin bölümlerinin çıkartılmasını önerir. Örneğin, sistem veride yinelenen tireleme algılarsa, veriyi potansiyel olarak analiz için daha kullanışlı hale getirmek için bölümlerin ayrı sütunlara çıkartılmasını önerir.
  • Tarih Çıkartmaları - Tarihler algılandığında, sistem veri analizini çoğaltabilecek tarihin bölümlerinin çıkartılmasını önerir. Örneğin, bir fatura veya satın alma tarihinden haftanın gününü çıkartabilirsiniz.
  • Tam ve Kısmi Gizleme/Maskeleme/Silme - Kredi kartı numarası gibi duyarlı alanlar algılandığında, sistem sütunun tam veya kısmi olarak maskelenmesini veya hatta kaldırılmasını önerir.

Tanınan Düzen Tabanlı Semantik Türleri

Semantik tipleri verilerinizde bulunan düzenlere göre tanımlanır.

Şu semantik türleri için öneriler sağlanır:

  • Tarihler (30'dan fazla formatta)
  • ABD Sosyal Güvenlik Numaraları (SSN)
  • Kredi Kartı Numaraları
  • Kredi Kartı Özellikleri (CVV ve Geçerlilik Bitiş Tarihi)
  • E-posta Adresleri
  • Kuzey Amerika Planı Telefon Numaraları
  • ABD Adresleri

Referans Tabanlı Semantik Türleri

Semantik türlerinin tanınması, hizmetin sağladığı yüklenmiş referans bilgisine göre belirlenir.

Referans tabanlı öneriler şu semantik türleri için sağlanır:

  • Ülke adları
  • Ülke kodları
  • Eyalet adları (İller)
  • Eyalet kodları
  • İlçe adları (Yetki Bölgeleri)
  • Şehir adları (Yerelleştirilmiş Adlar)
  • Posta kodları

Önerilen Geliştirmeler

Önerilen geliştirmeler semantik türlerini temel alır.

Geliştirmeler, coğrafi konum hiyerarşisine dayalı olarak belirlenir:

  • Ülke
  • İl (Eyalet)
  • Yetki Bölgesi (Kasaba)
  • Boylam
  • Enlem
  • Nüfus
  • Rakım (Metre)
  • Saat dilimi
  • ISO ülke kodları
  • Federal Bilgi İşleme Serisi (FIPS)
  • Ülke adı
  • Başkent
  • Kıta
  • Coğrafi Ad No
  • Konuşulan diller
  • Telefon ülke kodu
  • Posta kodu formatı
  • Posta kodu düzeni
  • Telefon ülke kodu
  • Para birimi adı
  • Para birimi kısaltması
  • Coğrafi üst düzey etki alanı (GeoLTD)
  • KM Kare

Gerekli Eşikler

Profil oluşturma işlemi, belirli semantik türleri hakkında karar almak için belirli eşikler kullanır.

Genel bir kural olarak, sistemin sınıflandırma belirlemesini yapabilmesi için sütundaki veri değerlerinin %85'i tek bir semantik türe ait ölçütleri karşılamalıdır. Sonuç olarak, %70 adlardan ve %30 "diğer" öğelerden oluşan bir sütun eşik gereksinimlerini karşılamayabilir ve dolayısıyla hiçbir öneri yapılmaz.

Özel Bilgi Önerileri

Oracle Analitik sistem bilgisini artırmak için özel bilgi önerilerini kullanın. Özel bilgi, Oracle Analitik semantik profil oluşturucunun daha işe özel semantik tipleri tanımlamasının yanı sıra daha ilgili ve yönetilen artırım önerileri yapmasına olanak tanır. Örneğin, reçeteli ilaçları Denetimsiz Semantik Ayrıştırma ilaç kategorileri olan Analjezikler veya Opioid olarak sınıflandıran özel bir bilgi referansı ekleyebilirsiniz.

Eğitim Programı simgesi Eğitim Programı

Yöneticinizden özel bilgi dosyalarını Oracle Analitik'e yüklemesini isteyin. Veri kümelerini zenginleştirdiğinizde Oracle Analitik, bu semantik verilere dayalı olarak zenginleştirme önerileri sunar. Çalışma kitapları oluşturduğunuzda, görselleştirmelerinize Veri Panelinden bilgi zenginleştirmelerini de ekleyebilirsiniz.

Kendi Özel Bilgi Dosyalarınızı Oluşturma

Semantik dosyaları oluştururken aşağıdaki yönergeleri izleyin:

  • CSV veya Microsoft Excel (XLSX) formatında bir veri dosyası oluşturun. Yükleyebileceğiniz maksimum dosya boyutu 250 MB'tır.
  • Oracle Analitik'in veri profili oluşturmak için kullandığı ilk sütunu anahtarla doldurun. Örneğin, verilerin mali yıl bazında analiz edilmesini sağlamak için anahtar günün ayrıntı düzeyini içeren bir tarih olabilir.
  • Diğer sütunları artırım değerleriyle doldurun.

Yöneticinizden özel bilgi dosyanızı Oracle Analitik'e yüklemesini isteyin.

Örnek - İş Zaman Çerçevelerini Verilerinize Entegre Etme

Bu örnek, satış verilerine iş zaman dilimlerini nasıl ekleyebileceğinizi ve esas veri kümesi mali veri içermiyorsa mali yıl bazında satış analizini nasıl etkinleştirebileceğinizi gösterir.

Örnek görselleştirme, her yılın farklı bir renkte temsil edildiği 2019, 2020, 2021, 2022 ve 2023 yıllarında üç aylık dönem bazında satışları gösterir. Kaynak satış verilerinizde mali verileriniz olmadığından veri kümenize mali veri eklemek için ek özel bilgileri devreye alırsınız.

İlk olarak, mali verileri Mali Calendar.xlsx dosyasında hazırlarsınız. Dosyanız tarih (aa-gg-yyyyy) mali yıl, mali ay ve mali hafta içerir. Örneğin, kaynak dosyanız tarih sütununda 23-01-2025, mali yıl sütununda 2025 ve kalan sütunları tamamlamaya yönelik özniteliklere sahip olabilir.

Yöneticinizden Mali Calendar.xlsx dosyasını Konsoldaki özel bilgi alanına yüklemesini isteyin.

Daha sonra Satış ve ORDER_DATE içeren bir veri kümesi oluşturursunuz ve veri kümesi düzenleyicisinde zenginleştirme önerilerinde ORDER_DATE Değerini Mali Yılla Zenginleştir ve ORDER_DATE Değerini Mali Ayla Zenginleştir seçeneklerini belirlersiniz. Oracle Analitik, bu iki zenginleştirmeyi veri kümesine ekler.

Son olarak, bir çalışma kitabı oluşturur ve bir görselleştirmeye Mali Yıl ve Mali Üç Aylık Dönem (ORDER_DATE altında) ve Satış eklersiniz. Not: Mali Yıl ve Mali Üç Aylık Dönem'i, orijinal ORDER_DATE sütununu eklemek zorunda kalmadan doğrudan ekleyebilirsiniz.