Présentation du repérage de données

Le repérage de données vous permet de trouver des données confidentielles dans vos bases de données Oracle.

Recherche de données confidentielles via le repérage de données

La protection des données confidentielles commence par l'identification de ces données et de leur emplacement. Pour repérer des données confidentielles dans vos bases de données cible, le repérage de données s'appuie principalement sur les types de confidentialité. Le repérage de données recherche également des relations référentielles basées sur un dictionnaire pour trouver des relations parent-enfant. Vous pouvez aussi décider que le repérage de données recherche les relations référentielles hors dictionnaire (relations au niveau de l'application).

Le repérage de données recherche des colonnes confidentielles dans les bases de données Oracle à l'aide des types de confidentialité prédéfinis Oracle et définis par l'utilisateur que vous choisissez. Vous indiquez les éléments à rechercher et le travail de repérage de données trouve les colonnes confidentielles qui répondent à vos critères.

Pour vous aider à valider les colonnes confidentielles repérées, vous pouvez décider de collecter des données échantillon à partir des bases de données cible lors du repérage de données. Soyez prudent lorsque vous utilisez cette fonctionnalité car les données échantillon sont des données confidentielles. Seules des personnes autorisées doivent pouvoir collecter et consulter ces données échantillon.

Repérage via des types de confidentialité

Un type de confidentialité définit des expressions régulières qui aident à rechercher des colonnes confidentielles en fonction des noms de colonne, des données et des commentaires. Oracle Data Safe fournit plus de 170 types de confidentialité prédéfinis que vous pouvez utiliser pour rechercher des données confidentielles. Les types de confidentialité prédéfinis sont organisés en catégories, ce qui facilite la recherche et l'utilisation des types de confidentialité pertinents. Vous ne pouvez pas modifier ni supprimer les types de confidentialité prédéfinis. Vous pouvez toutefois créer vos propres types et catégories de confidentialité. Le repérage de données ne permet pas de repérer des colonnes confidentielles qui utilisent un type de données object.

Les catégories de niveau supérieur pour les types de confidentialité prédéfinis sont les suivantes :

Informations d'identification : inclut les types de confidentialité relatifs à des identifiants nationaux, personnels et publics. Par exemple, le numéro de sécurité sociale américain (SSN), le numéro d'assurance sociale canadien (SIN), d'autres numéros d'identification nationale, le numéro de visa et le nom complet.
Données biographiques : inclut les types de confidentialité relatifs à ces adresses, données familiales, informations d'identification personnelle étendues et aux données du traitement restreint. Exemples : Adresse complète, Nom de jeune fille de la mère, Date de naissance et Religion
Informations informatiques : inclut les types de confidentialité relatifs au données informatiques et au données de dispositif de l'utilisateur. Exemple : ID utilisateur, Mot de passe et Adresse IP
Informations financières : inclut les types de confidentialité relatifs au compte de carte de paiement et au compte bancaire. Exemples : Numéro de carte, Code PIN de sécurité de carte et Numéro de compte bancaire
Données relatives à l'assurance maladie : inclut les types de confidentialité pour les données de l'assurance maladie, les données de fournisseurs de soins de santé et les données médicales. Exemples : Numéro d'assurance maladie, Fournisseur de soins de santé et Groupe sanguin.
Données d'emploi : inclut les types de confidentialité relatifs aux informations de base sur les employés, aux données de l'organisation et à la rémunération. Exemple : Intitulé du poste, Date de fin de contrat, Revenu et Actions.
Données de formation : inclut les types de confidentialité des données de base des étudiants, des données d'établissement et des données de performances. Exemples : Aide financière, Nom de l'université, Diplôme et Dossier disciplinaire.

Repérage via des relations référentielles basées sur un dictionnaire

Le repérage de données effectue une recherche dans le dictionnaire de données Oracle afin de repérer des relations entre les colonnes de clé primaire et les colonnes de clé étrangère. Elle marque ensuite ces colonnes associées comme confidentielles. Par exemple, supposons que vous ayez deux tables. La première table, CUSTOMERS, stocke des informations telles que le prénom, le nom et la date de début du client. La deuxième table, LOCATIONS, contient des informations sur les lieux de vente.

Dans la table CUSTOMERS, LOCATION_ID est défini comme une clé étrangère qui référence la clé primaire LOCATION_ID dans la table LOCATIONS. Le repérage de données recherche automatiquement ces types de relation référentielle.

Dans cet exemple, si un type de confidentialité est défini pour l'emplacement, la colonne LOCATION_ID des deux tables est identifiée comme confidentielle.

Repérage via des relations référentielles hors dictionnaire

Dans Oracle Data Safe, vous avez aussi la possibilité d'utiliser des relations référentielles hors dictionnaire pour identifier des colonnes confidentielles. Il s'agit des relations entre des colonnes de base de données qui sont définies dans des applications, mais ne sont pas enregistrées dans le dictionnaire des données Oracle. Le repérage de données utilise les modèles de nom de colonne et les modèles de données de colonne à partir des types de confidentialité sélectionnés pour repérer des relations potentielles entre les colonnes.

Par exemple, supposons qu'une table parent est appelée CUSTOMER et qu'une table associée est appelée PAYMENT_METHOD. La colonne confidentielle est CUST_NAME dans la table parent et CUST_NM dans la table associée. Si la table associée a été créée sans afficher de lien entre le dictionnaire de données et la table parent (c'est-à-dire qu'aucune information de clé étrangère n'a été entrée dans le dictionnaire de données), la relation entre la table parent et la table associée constitue une "relation référentielle hors dictionnaire".

Modèles de données confidentielles

Le repérage de données enregistre les résultats du repérage sous forme de modèle de données confidentielles dans un compartiment indiqué d'Oracle Cloud Infrastructure. Vous trouverez les modèles de données confidentielles auxquels vous avez accès sur la page Modèles de données confidentielles d'Oracle Data Safe. Les résultats se composent de colonnes confidentielles, de relations référentielles et d'un niveau de confiance.

La colonne Niveau de confiance d'un modèle de données confidentielles représente le degré de certitude de sa classification pour un type de confidentialité donné. Vous verrez qu'il est classé comme élevé, moyen ou bas. Le niveau de confiance Aucun, affiché sous la forme -, s'affiche pour les colonnes ajoutées manuellement. Le score de confiance est déterminé en évaluant plusieurs attributs, notamment si les données, le nom et les commentaires de la colonne sont mis en correspondance. Il recherche également des types de confidentialité similaires trouvés dans les mêmes tables ou les tables associées, car la similarité contextuelle peut renforcer la confiance. En outre, le scoring évalue si la colonne peut former des informations d'identification personnelle (PII) lorsqu'elle est combinée avec d'autres colonnes de la même table ou des tables associées (tables qui partagent des relations référentielles), ainsi que si ces combinaisons se produisent dans des tables non liées. Actuellement, les évaluations basées sur les types de confidentialité dans les mêmes tables ou les tables associées, ainsi que les colonnes formant des informations d'identification personnelle dans les tables associées ou non, sont limitées aux schémas et aux types de confidentialité inclus dans la portée de repérage.

Par exemple, prenons une colonne nommée CUST_EMAIL dans la table CUSTOMERS. Le nom de colonne correspond clairement au type de confidentialité Email Address, ce qui contribue au score de confiance. Les données de la colonne suivent également des modèles d'adresse e-mail valides, ce qui renforce la confiance. En outre, une table associée appelée ORDERS contient la colonne CUST_PHONE, qui est également classée comme informations d'identification personnelle, renforçant ainsi le contexte. En fonction de ces attributs, un niveau de confiance élevé est affecté à la colonne CUST_EMAIL.

En cas de modifications sur une base de données cible, vous pouvez apporter des mises à jour incrémentielles à un modèle de données confidentielles, ajouter et enlever des colonnes confidentielles dans le modèle, ainsi que gérer les relations référentielles entre les colonnes confidentielles. La colonne Niveau de confiance est mise à jour lorsque le repérage incrémentiel est effectué, ce qui vous permet de visualiser les niveaux de confiance à la fin de la création du modèle de données confidentielles et après l'exécution d'un travail de repérage incrémentiel. Vous pouvez télécharger un modèle de données confidentielles en local, le modifier hors ligne, puis le télécharger vers la même région ou d'autres régions Oracle Data Safe. Un modèle de données confidentielles n'est associé qu'à une seule base de données cible à la fois, mais vous pouvez changer cette base de données en cas de besoin.

Vous pouvez créer un modèle de données confidentielles vide directement, ce qui permet une approche personnalisée du suivi et du masquage des objets sensibles. Au lieu d'exécuter le repérage de données et d'enlever les colonnes indésirables, vous pouvez créer un modèle de données confidentielles sans colonnes prédéfinies, puis ajouter uniquement les colonnes qui vous intéressent.

Pour vous aider à comprendre vos données confidentielles et à des fins de conservation des enregistrements, le repérage de données fournit des rapports téléchargeables concernant les modèles de données confidentielles et les repérages incrémentiels. Ces deux types de rapports fournissent les nombres totaux des tables, colonnes et valeurs confidentielles, ainsi que des détails sur les colonnes confidentielles. Les colonnes confidentielles sont classées en fonction de leur type de confidentialité.

Vous pouvez éventuellement stocker des métadonnées dans un modèle de données confidentielles, y compris des données échantillon et des estimations de nombre de lignes. Ces informations vous donnent un aperçu de la quantité des différents types de données confidentielles dans vos bases de données cible.

Vous pouvez utiliser un modèle de données confidentielles pour implémenter d'autres contrôles de sécurité, tels que le masquage des données. Par exemple, vous pouvez définir une stratégie de masquage à l'aide d'un modèle de donnée confidentielle et l'utiliser pour masquer les données confidentielles sur des bases de donnée cible. Vous pouvez réutiliser un modèle de données confidentielles pour plusieurs stratégies de masquage.

Page de renvoi de repérage de données

La page de renvoi de repérage de donnée fournit une vue d'ensemble des données confidentielles stockées dans les bases de donnée cible des compartiments sélectionnés. Vous pouvez modifier les filtres définis sur les groupes de bases de données cible et les groupes de types de confidentialité selon vos besoins. Les graphiques et les tables sont immédiatement mis à jour.

Onglet Types de confidentialité

L'onglet Types de confidentialité du tableau de bord Repérage de données présente la fréquence d'utilisation des 21 types de confidentialité courants dans le parc de bases de données cible. Les 21 types de confidentialité courants ont été identifiés par Oracle comme les types de confidentialité les plus susceptibles d'être présents dans une base de données. Utilisez la recherche de type de confidentialité pour connaître la fréquence d'utilisation des autres types de confidentialité dans le parc de bases de données cible.

Le graphique Types de confidentialité vous aide à identifier les types de confidentialité les plus courants dans vos bases de données cible, en affichant une ventilation en pourcentage des 21 types de confidentialité courants dans votre parc de bases de données cible.

La table Types de confidentialité vous aide à déterminer si le repérage de données est bien utilisé dans le parc de bases de données cible, en indiquant le nombre de bases de données ayant et n'ayant pas encore créé de modèle de données confidentielles.

L'image suivante présente la liste des types de confidentialité dans le repérage de données.

Description de l'illustration discovery-dashboard-common-sensitive-tab.png

Onglet Bases de données cible

Les graphiques en haut du tableau de bord se concentrent sur les cinq bases de données cible principales. Le graphique 5 principales cibles (par colonnes confidentielles) permet d'identifier les bases de données cible qui ont la plus grande concentration de colonnes confidentielles en affichant la répartition en pourcentage de colonnes confidentielles sur chacune des cinq bases de données cible principales. Le graphique 5 principales cibles (par valeurs confidentielles) vous permet d'identifier les bases de données cible qui contiennent les valeurs confidentielles les plus importantes en affichant le pourcentage de valeurs confidentielles dans chacune des cinq cibles.

L'image suivante présente un récapitulatif des données confidentielles pour les bases de données cible dans les compartiments sélectionnés.

Description de l'illustration data-discovery-dashboard.png

Les graphiques sont suivis du récapitulatif des données confidentielles pour les bases de données cible dans les compartiments sélectionnés. Ce récapitulatif vous permet de comparer les statistiques des diverses bases de données cible, notamment le nombre de modèles de données confidentielles créés pour chacune d'entre elles, ainsi que le nombre de types de confidentialité, de schémas confidentiels, de tables confidentielles, de colonnes confidentielles et de valeurs confidentielles qu'elles contiennent.

Dans le récapitulatif des données confidentielles, sélectionnez l'onglet Bases de données cible, puis sélectionnez un nom de base de données cible pour visualiser l'onglet Détails et l'onglet Modèles de données confidentielles. L'onglet Modèles de données confidentielles répertorie les modèles de données confidentielles associés à la base de données cible sélectionnée. Pour chaque modèle de données confidentielles, cette table indique le nom de la cible et la quantité de chacun des éléments suivants dans le modèle : types de confidentialité, schémas confidentiels, tables confidentielles, colonnes confidentielles et valeurs confidentielles.

Workflow de repérage de données

Avant de créer un modèle de données confidentielles, vous devez effectuer les opérations suivantes :

Accédez aux droits d'accès appropriés dans Oracle Cloud Infrastructure Identity and Access Management, puis inscrivez la base de données cible.
(Facultatif) Si les statistiques au niveau des schémas ne sont pas à jour, collectez les statistiques de schéma de la base de données cible pour garantir l'exactitude des résultats. Pour ce faire, exécutez la procédure dbms_stats.gather_schema_stats. Nous vous recommandons d'exécuter cette procédure uniquement si nécessaire car il s'agit d'une opération gourmande en ressources. Pour plus d'informations sur les paramètres que vous pouvez inclure, reportez-vous à Procédures GATHER_SCHEMA_STATS. L'exemple suivant collecte des statistiques sur le schéma HCM1 :
```
exec dbms_stats.gather_schema_stats(ownname => 'HCM1');
```

Vous êtes maintenant prêt à créer un modèle d'informations confidentielles. Lorsque vous utilisez le repérage de données, procédez comme suit pour créer un modèle de données confidentielles :

Renseignez les informations du modèle de données confidentielles, puis sélectionnez une base de données cible.
(Facultatif) Si les schémas de la base de données cible ont été mis à jour depuis la date et l'heure indiquées, sélectionnez Actualiser les schémas de base de données.
Sélectionnez les schémas dans lesquels rechercher des données confidentielles. Vous pouvez également sélectionner tous les schémas. Seuls les schémas non gérés par Oracle sont affichés et sélectionnables.
Sélectionnez les types de confidentialité à rechercher dans la base de données cible. Vous pouvez également sélectionner tous les types de confidentialité.
Sélectionnez des options de repérage facultatives, notamment l'extraction de données échantillon et la recherche de relations référentielles au niveau de l'application.

Une fois le modèle de données confidentielles initialement rempli avec des colonnes confidentielles, vous devez effectuer les opérations suivantes :

Vérifiez les colonnes confidentielles obtenues.
Modifiez le modèle de données confidentielles selon vos besoins afin qu'il reflète précisément les données confidentielles au sein de la base de données cible.
Configurer les notifications d'événement. Par exemple, vous pouvez créer un événement Sensitive Data Model Create Begin pour être informé automatiquement si un modèle de données confidentielles est créé.

Au bout d'un certain temps, vous pourrez être amené à réaliser les tâches suivantes :

Utiliser le modèle de données confidentielles avec d'autres bases de données cible. Pour ce faire, vous pouvez télécharger et télécharger le modèle de données confidentielles vers une autre région Oracle Data Safe. Vous pouvez également associer un modèle de données confidentielles à une autre base de données cible.
Déplacer le modèle de données confidentielles vers un autre compartiment.
Supprimer le modèle de données confidentielles.
Créez un modèle de données confidentielles manuellement, ce qui permet une approche personnalisée du suivi et du masquage des objets sensibles.
- Au lieu d'exécuter le repérage de données et d'enlever les colonnes indésirables, vous pouvez créer un modèle de données confidentielles sans colonnes prédéfinies, puis ajouter uniquement les colonnes qui vous intéressent.
- Pour ce faire, cliquez sur le bouton Créer manuellement un modèle de données confidentielles dans le tableau de bord ou cochez la case Créer manuellement un modèle de données confidentielles dans le panneau Repérer les données confidentielles.
- Une fois le nouveau modèle de données confidentielles créé, sélectionnez Ajouter des colonnes pour ajouter manuellement des colonnes intéressantes au modèle de données confidentielles.

Types de données, objets et fonctionnalités de base de données non pris en charge pour le repérage de données

Types de données non pris en charge pour le repérage de données pour l'analyse de contenu/modèle de données :

LONG*
RAW*
FICHIER B*
BLOB*
JSON

* LONG/RAW, BFILE et BLOB peuvent toujours être repérés à partir de métadonnées, telles que les noms de colonne et les commentaires.

Types d'objet non pris en charge pour le repérage de données :

XMLTYPE
HTTPURITYPE
XDBURITYPE
DBURITYPE
ADT

Fonctionnalités de base de données non prises en charge pour le repérage de données :

Tables externes
Tables temporaires
Voir
Index
Tables imbriquées

Prérequis pour l'utilisation du repérage de données

Voici les prérequis pour utiliser le repérage de données :

Inscrivez les bases de données cible à utiliser avec Data Discovery.
- Si une base de données cible est déjà inscrite auprès d'Oracle Data Safe par quelqu'un d'autre, vous devez obtenir le droit d'accès READ sur la ressource de base de données cible dans Oracle Cloud Infrastructure Identity and Access Management (IAM) pour exécuter les travaux de repérage.
Accordez le rôle de repérage de données sur la base de données cible. Un administrateur de base de données peut accorder ce rôle au compte de service Oracle Data Safe sur la base de données cible.
Obtenez le droit d'accès dans IAM pour utiliser la fonctionnalité de repérage de données dans Oracle Data Safe. Un administrateur de location peut accorder ces droits d'accès. Les ressources suivantes requièrent des droits d'accès :
- data-safe-discovery-jobs
  
  Le droit d'accès manage est requis pour exécuter les travaux de repérage.
- data-safe-sensitive-data-models
  
  Le droit d'accès manage est requis pour exécuter les travaux de repérage et modifier les modèles de données confidentielles.
- data-safe-sensitive-types
  
  Le droit d'accès manage est requis pour créer des types de confidentialité.
- data-safe-work-requests
  
  Le droit d'accès read est requis pour afficher les demandes de travail.
Au lieu d'accorder des droits d'accès de manière sélective, vous pouvez les accorder sur data-safe-discovery-family dans les compartiments pertinents. Cela inclura les droits d'accès sur toutes les ressources ci-dessus. Reportez-vous à data-safe-discovery-family Resource.

Remarque

Remarque : Etant donné que la fonction Repérage de données a été déplacée de la console Oracle Data Safe vers un centre de sécurité dans Oracle Cloud Infrastructure, un administrateur doit migrer les privilèges de repérage de données existants vers IAM. Une fois cette migration terminée, vous pouvez accorder des privilèges à des groupes d'utilisateurs supplémentaires dans IAM pour leur permettre d'utiliser la fonctionnalité de repérage de données.

Rubriques connexes

Octroi de rôles au compte de service Oracle Data Safe sur la base de données cible. Cette rubrique décrit les rôles requis pour le repérage de données et d'autres fonctionnalités d'Oracle Data Safe.
Création de stratégies IAM pour Oracle Data Safe. Cette rubrique décrit les privilèges requis pour chaque fonctionnalité dans Oracle Data Safe.

Documentation Oracle Cloud Infrastructure