Transformation de données à l'aide du remplacement

Transformez les données d'une colonne à l'aide d'une simple correspondance de modèle ou d'une expression régulière. Par exemple, dans une colonne State, vous pouvez remplacer CA par California.

Vous pouvez utiliser n'importe quelle expression PCRE (Perl Compatible Regular Expression), également appelée expression régulière. Les transformations sont appliquées à toutes les lignes concernées de l'ensemble de données.
  1. Sur la page d'accueil, ouvrez un ensemble de données ou un classeur.
    • Placez le curseur de la souris sur l'ensemble de données, cliquez sur Actions, puis sélectionnez Ouvrir. Dans le diagramme de données ou de jointure, cliquez avec le bouton droit de la souris sur une source de données et cliquez sur Ouvrir pour afficher l'éditeur de transformation.
    • Positionnez le curseur de la souris sur le classeur qui contient l'ensemble de données, cliquez sur Actions, puis sélectionnez Ouvrir et cliquez sur Données. Dans le diagramme de données ou de jointure, cliquez avec le bouton droit de la souris sur une source de données et cliquez sur Ouvrir pour afficher l'éditeur de transformation.

    Remarque :

    Oracle Analytics affiche un diagramme de données pour les ensembles de données contenant une seule table et un diagramme de jointure pour ceux en contenant plusieurs.
  2. Positionnez le curseur de la souris sur la colonne de texte à transformer ou sélectionnez-la.
  3. Cliquez sur Options au bas de la mosaïque de qualité, puis cliquez sur Remplacer.
    Conseil : pour remplacer plusieurs valeurs à la fois, utilisez l'option Liste des valeurs de remplacement.
  4. Dans l'éditeur d'étape Remplacer, indiquez la façon dont vous souhaitez rechercher les valeurs. Par exemple :
    • Cliquez sur Utiliser une expression régulière pour effectuer la recherche à l'aide d'une expression régulière complexe.
    • Cliquez sur Mettre en correspondance les valeurs entières uniquement pour remplacer "male" par "M", mais pas "female" par "feM".
  5. Dans le champ Chaîne à remplacer et dans le champ Nouvelle chaîne, indiquez le texte littéral ou les expressions régulières à rechercher et à remplacer (respect maj./min.).
    Exemples :
    • Pour remplacer "2553 Bolman Court" par "2553 #Bolman# #Court#", sélectionnez Utiliser l'expression régulière, saisissez ([A-Za-z]+) dans le champ Chaîne à remplacer et #$1# dans le champ Nouvelle chaîne.
    • Pour remplacer "male" par "M", sélectionnez Mettre en correspondance les valeurs entières uniquement, saisissez male dans le champ Chaîne à remplacer et M dans le champ Nouvelle chaîne Vous remplacez ainsi "male" par "M", mais pas "female" par "feM".

    Après avoir rempli les deux champs, vous obtenez un aperçu des données transformées dans le panneau d'aperçu. Ajustez les options de remplacement jusqu'à obtenir la transformation voulue dans le panneau d'aperçu.
  6. Cliquez sur Ajouter une étape.
    Oracle Analytics ajoute une étape dans le panneau Script de préparation.
  7. Pour enregistrer les modifications de préparation des données et les appliquer à vos données, cliquez sur Enregistrer.

Exemple de transformations de remplacement à l'aide d'expressions régulières

Voici quelques exemples d'utilisation d'expressions régulières pour transformer des données.

Dans ces exemples, Expression de recherche affiche ce que vous devez saisir dans le champ Chaîne à remplacer, et Valeur de remplacement affiche ce que vous devez saisir dans le champ Nouvelle chaîne.

Tableau 3-1 Exemples de transformations de remplacement

Expression de recherche Valeur de remplacement Texte d'origine Texte remplacé Remarques
@([a-z]+)(?=\.[a-z]{3}) @example MichelePFalk@yahoo.com MichelePFalk@example.com Cet exemple remplace les détails de domaine dans les adresses électroniques.
^Gray|Grey$ Silver

Grey

Gray

Graystone

Silver

Silver

Graystone

Les caractères ^$ indiquent que seules les correspondances de chaîne complètes sont recherchées. La barre verticale est l'expression régulière pour OR. Ainsi, dans le cas présent, l'expression régulière recherche "Gray" ou "Grey" et les remplace par "Silver".

La chaîne Graystone n'est pas transformée car l'expression régulière recherche uniquement les correspondances de valeur complètes.

\d+ 9999

8398 Park Street

123 Oracle Parkway

9999 Park Street

9999 Oracle Parkway

Cette expression régulière recherche un " \d" ou plusieurs "+" chiffres et les remplace par "9999". Le remplacement fonctionne également si le texte d'origine comprend seulement trois chiffres.
([A-z]+)(\d+) $2

UA101654

US829383

101654

829383

Cette expression régulière recherche une ("[A-z]") ou plusieurs ("+") lettres consécutives suivies d'un ("\d") ou plusieurs ("+") chiffres. Chacune des deux expressions est délimitée par des parenthèses, qui capturent deux groupes : le premier ([A-z]) et le second (\d+). Ces groupes sont numérotés de façon automatique et peuvent être utilisés dans le remplacement par le biais du signe dollar pour le second groupe, par exemple, "$2".
([A-z]+)(\d+) Code postal : $2

UA101654

US829383

Code postal : 101654

Code postal : 829383

Cet exemple emploie la même expression de correspondance que l'exemple précédent, à la différence qu'il montre comment insérer votre propre texte de remplacement en plus d'un groupe. Le texte peut être inséré avant et après un groupe de correspondance rappelé.