1 Déploiement des solutions Oracle HSM

Le déploiement de Oracle Hierarchical Storage Manager et le logiciel StorageTek QFS (Oracle HSM) est un processus relativement simple. Il vous suffit d'installer des packages logiciels, de modifier quelques fichiers de configuration, d'exécuter une ou deux commandes puis de monter et d'utiliser le ou les nouveaux systèmes de fichiers. Cependant, Oracle HSM propose une large gamme d'options et de paramètres de réglage. Ces fonctionnalités supplémentaires peuvent vous permettre de répondre à quasiment tous les besoins spécifiques. Mais des fonctionnalités inutiles tendent également à rendre plus complexe le déploiement et à donner lieu à une solution peu satisfaisante.

Ce document a donc pour objet de vous aider à déployer Oracle HSM en respectant au plus près vos besoins spécifiques à l'égard de la solution. Il commence par traiter les principes, l'installation et la configuration de base des systèmes de fichiers Oracle HSM et QFS. Ces systèmes de fichiers pourront soit répondre à l'ensemble de vos exigences, soit former la base d'une solution plus spécialisée. Une fois les éléments de base mis en place, vous pouvez passer aux procédures de configuration de fonctionnalités supplémentaires qui prennent en charge des environnements spécifiques et des besoins professionnels particuliers. Vous exécuterez les tâches centrales suivantes :

  • Configurer le matériel et le système d'exploitation conformément à vos besoins.

  • Configurer les systèmes de fichiers de base QFS et/ou Oracle HSM requis, en acceptant dans la mesure du possible les valeurs par défaut.

  • Configurer toutes les fonctionnalités Oracle HSM supplémentaires requises.

  • Sauvegarder votre configuration terminée et la mettre à disposition pour qu'elle soit testée et utilisée en production.

Lors de l'ensemble du processus de planification et de déploiement, n'oubliez pas que QFS et Oracle HSM sont conçus pour masquer les complexités de l'optimisation des performances, de la protection de données et de l'archivage derrière une interface simple de systèmes de fichiers UNIX. Les utilisateurs, les applications et la plupart des administrateurs doivent pouvoir traiter un système d'archivage Oracle HSM entièrement optimisé, implémenté sur un ensemble de baies de disques et de bibliothèques de bandes comme s'il s'agissait d'un système de fichiers UFS habituel sur un disque local unique. Une fois installé et configuré, le logiciel Oracle HSM doit permettre de gérer automatiquement vos données et vos ressources de stockage de la manière la plus fiable et efficace possible, le tout en nécessitant le moins d'interventions possibles. Par conséquent, les implémentations extrêmement complexes et la microgestion excessive de systèmes de fichiers et de ressources de stockage vont à l'encontre des objectifs principaux d'un déploiement de Oracle HSM, tout en détériorant fréquemment les performances, l'utilisation des capacités et/ou la protection des données.

La suite de cette introduction fournit une brève description générale des systèmes de fichiers QFS et des systèmes de fichiers d'archivage Oracle HSM. Des connaissances de base en la matière facilitent la compréhension de l'objectif des étapes de configuration suivantes.

Systèmes de fichiers QFS

Les systèmes de fichiers QFS vous permettent d'associer des solutions de stockage entièrement personnalisées et optimisées à des interfaces UNIX standard. En interne, ils gèrent des périphériques de stockage physiques de manière à ce qu'ils répondent à des exigences de performances élevées et souvent très spécialisées. Mais aux yeux des utilisateurs externes, des applications et des systèmes d'exploitation, ils restent des systèmes de fichiers UNIX ordinaires. Ainsi, vous pouvez satisfaire des exigences de performances et de protection de données spécialisées à l'aide d'une gamme complexe de matériel de stockage et garantir en même temps une intégration simple aux applications et processus métier existants.

Les systèmes de fichiers QFS gèrent leur propre stockage physique à l'aide d'un gestionnaire de volumes QFS. Le logiciel QFS organise les périphériques de stockage physique standard en périphériques logiques hautement optimisés qui restent entièrement compatibles avec les interfaces standard. Le logiciel incorpore des fonctionnalités et personnalisations spécifiques de manière à ce que le système d'exploitation et les applications ne puissent les détecter. Pour les applications, le logiciel QFS présente un périphérique de famille logique qui traite les demandes d'E/S comme un disque simple, via des pilotes de périphérique Solaris standard. Cette combinaison de conformité aux normes et d'ajustabilité distingue QFS des autres systèmes de fichiers UNIX.

La suite de cette section commence par une brève présentation des valeurs par défaut QFS et du réglage des performances d'E/S, puis décrit les outils principaux qui vous permettent de contrôler le comportement d'E/S des systèmes de fichiers créés :

Valeurs par défaut de QFS et objectifs de réglage des performances des E/S

L'E/S de disque (entrée/sortie) fait intervenir des demandes au système d'exploitation gourmandes en CPU et des processus mécaniques chronophages. Par conséquent, le réglage des performances d'E/S vise avant tout à réduire les surcharges système associées aux E/S et à limiter autant que possible le travail mécanique nécessaire pour transférer une quantité de données particulière. Pour ce faire, il est nécessaire de réduire à la fois le nombre d'E/S distinctes par transfert de données (et par conséquent le nombre d'opérations que la CPU effectue) et de minimiser le nombre de recherches (mouvements des têtes de lecture/écriture) requis pour chaque E/S. Ainsi, les objectifs de base du réglage des E/S sont les suivants :

  • Lecture et écriture des données dans des blocs qu'il soit possible de subdiviser uniformément en fichiers de taille moyenne.

  • Lisez et écrivez des blocs de données de grande taille.

  • Ecriture des blocs en unités alignées sur les limites sectorielles de 512 octets du média sous-jacent, afin que le contrôleur de disque n'aie pas à lire ni à modifier les données existantes avant d'écrire de nouvelles données.

  • Mettez des petites E/S en file d'attente et écrivez des E/S combinées plus larges sur le disque.

Les paramètres par défaut de Oracle HSM offrent les meilleures performances pour la gamme d'applications et de schémas d'utilisation typiques de la majorité des systèmes de fichiers à usage généraliste. Mais lorsque cela est nécessaire, vous pouvez régler le comportement par défaut pour qu'il soit mieux adapté aux types d'E/S que vos applications produisent. Vous pouvez indiquer la taille minimale des opérations de lecture ou écriture contigües. Vous pouvez optimiser le stockage des fichiers sur les périphériques. Vous pouvez choisir entre les systèmes de fichiers optimisés pour une utilisation généraliste ou pour un niveau élevé de performances.

Unités d'allocation de disque et types de périphérique logiques

Les systèmes de fichiers allouent du stockage sur disque en blocs de taille uniforme. Cette taille, appelée unité d'allocation de disque (DAU), détermine la quantité minimum d'espace contigu que chaque opération d'E/S consomme, quelle que soit la quantité de données écrite, et le nombre minimum d'opérations d'E/S nécessaires lors du transfert d'un fichier d'une taille donnée. Si la taille de bloc est trop importante par rapport à la taille moyenne des fichiers, de l'espace disque est perdu. Si la taille de bloc est trop petite, chaque transfert de fichiers requiert un nombre d'opérations d'E/S plus grand, ce qui altère les performances. Par conséquent, l'efficacité des performances et du stockage des E/S sont à leur maximum lorsque les tailles de fichiers sont des multiples de la taille de bloc de base.

C'est pour cette raison que le logiciel QFS prend en charge une gamme de tailles de DAU configurables. Lorsque vous créez un système de fichiers QFS, vous déterminez d'abord la taille moyenne des fichiers de données auxquels vous devez accéder et que vous devez stocker. Puis vous définissez la DAU qui se répartit le plus régulièrement dans la taille moyenne du fichier.

Commencez par sélectionner le type de périphérique QFS qui convient le mieux à vos données. Il en existe trois types :

  • Périphériques md

  • Périphériques mr

  • Périphériques de groupe entrelacé gXXX (où XXX est un nombre entier compris dans l'intervalle [0-127].

Lorsque des systèmes de fichiers contiendront une majorité de petits fichiers ou un mélange de petits et gros fichiers, les périphériques md sont généralement le meilleur choix. Le type de périphérique md utilise un schéma souple à double allocation. Lors de l'écriture d'un fichier sur le périphérique, le système de fichiers utilise une petite unité d'allocation de disque de 4 kilo-octets pour les huit premières écritures. Il écrit ensuite toutes les données restantes en utilisant une DAU plus importante sélectionnée par l'utilisateur de 16, 32 ou 64 kilo-octets. Ainsi, les petits fichiers sont écrits dans des petits blocs adaptés et les fichiers plus volumineux sont écrits dans des blocs plus grands correspondant à la taille moyenne des fichiers.

Si des systèmes de fichiers contiennent une majorité de grands fichiers et/ou de fichiers de même taille, les périphériques mr peuvent être la bonne solution. Le type de périphérique mr utilise une DAU réglable par incréments de 8 kilo-octets dans l'intervalle [8-65528] kilo-octets. Les fichiers sont écrits dans de gros blocs uniformes de taille quasiment identique à la taille moyenne des fichiers, ce qui réduit les surcharges de lecture-modification-écriture et maximise les performances.

Les groupes entrelacés sont des agrégats pouvant compter jusqu'à 128 périphériques, qui sont traités comme un périphérique logique unique. Comme le type de périphérique mr, les groupes entrelacés utilisent une DAU réglable par incréments de 8 kilo-octets dans l'intervalle [8-65528] kilo-octets. Le système de fichiers écrit les données sur les membres d'un groupe entrelacé en parallèle, avec une DAU par disque. Par conséquent, l'écriture de l'agrégat peut être très volumineuse. Les groupes entrelacés sont ainsi potentiellement utiles dans les applications qui doivent gérer des fichiers de données extrêmement volumineux.

Méthodes d'allocation de fichiers

Par défaut, les systèmes de fichiers QFS non partagés utilisent l'allocation par entrelacement et les systèmes de fichiers partagés utilisent l'allocation circulaire. Mais vous pouvez modifier l'allocation en fonction des besoins. Chaque méthode a ses avantages selon les cas.

Allocation par entrelacement

Lorsque l'allocation par entrelacement a été spécifiée, le système de fichiers alloue l'espace en parallèle, sur tous les périphériques disponibles. Le système de fichiers segmente le fichier de données et écrit un segment sur chaque périphérique. La taille de chaque segment est déterminée par la largeur de bande (le nombre de DAU écrites par périphérique) multipliée par le nombre de périphériques compris dans la famille. Les périphériques peuvent être des disques md, des disquesmr ou des groupes entrelacés.

L'entrelacement améliore généralement les performances car le système de fichiers lit plusieurs segments de fichiers en même temps plutôt que de manière séquentielle. Plusieurs opérations d'E/S se produisent en parallèle sur des périphériques distincts, ce qui réduit la surcharge de recherche par périphérique.

Cependant, l'allocation par entrelacement peut accroître sensiblement le nombre de recherches lorsque plusieurs fichiers sont écrits en même temps. Un nombre excessif de recherches peut nettement altérer les performances. Vous avez donc tout intérêt à recourir à l'allocation circulaire si vous anticipez des E/S simultanées sur plusieurs fichiers.

Allocation circulaire

Lorsque vous choisissez l'allocation circulaire, le système de fichiers alloue l'espace de stockage de façon sérielle, à raison d'un fichier et d'un périphérique à la fois. Le système de fichiers écrit le fichier sur le premier périphérique présentant de l'espace disponible. Si le fichier est plus volumineux que l'espace restant sur le périphérique, le système de fichiers écrit la suite sur le périphérique suivant disposant d'espace libre. Pour chaque fichier ultérieur, le système de fichiers passe au périphérique suivant disponible et répète le processus. Lorsque le dernier périphérique disponible a été utilisé, le système de fichiers reprend du début avec le premier périphérique. Les périphériques peuvent être des disques md, des disquesmr ou des groupes entrelacés.

L'allocation circulaire peut améliorer les performances quand les applications effectuent des E/S sur plusieurs fichiers à la fois. Il s'agit également du paramétrage par défaut pour les systèmes de fichiers QFS partagés (reportez-vous à la Accès aux systèmes de fichiers à partir de plusieurs hôtes à l'aide du logiciel Oracle HSM et à la page de manuel mount_samfs pour plus d'informations sur les systèmes de fichiers partagés).

Allocation du stockage et gestion des volumes intégrée

Contrairement aux systèmes de fichiers UNIX qui concernent uniquement un périphérique ou une partie d'un périphérique, les systèmes de fichiers QFS effectuent leur propre gestion de volume. Chaque système de fichiers gère de façon interne les relations entre les périphériques qui fournissent son stockage physique, puis présente le stockage au système d'exploitation sous la forme d'une seule famille. Comme pour n'importe quel système de fichiers UNIX, les demandes d'E/S sont effectuées via des interfaces de pilotes de périphériques Solaris standard.

Types de systèmes de fichiers

Il existe deux types de systèmes de fichiers QFS : Chaque type présente ses propres avantages :

Systèmes de fichiers ms à usage généraliste

Les systèmes de fichiers ms QFS sont les plus simples à implémenter et sont bien adaptés aux objectifs les plus courants. Ils stockent les métadonnées du système de fichiers avec les données des fichiers sur les mêmes périphériques de disques md à double allocation. Cette méthode permet une configuration matérielle simplifiée qui répond à la majorité des besoins.

Systèmes de fichiers ma haute performance

Les systèmes de fichiers maQFS peuvent améliorer les taux de transfert des données dans les applications intensives. Ces systèmes de fichiers stockent les métadonnées et les données séparément, sur des périphériques dédiés. Les métadonnées sont conservées sur les périphériques mm, tandis que les données sont conservées sur un ensemble de périphériques de disques md, de périphériques de disquesmr ou de groupes entrelacés. Ainsi, les mises à jour de métadonnées ne rivalisent pas avec les E/S des utilisateurs et des applications, et les configurations de périphériques ne doivent pas s'adapter à deux types différents de charges de travail d'E/S. Vous pouvez, par exemple, placer les métadonnées sur des disques en miroir RAID 10 pour une redondance élevée et des lectures rapides, et conserver les données sur une baie de disques RAID 5 plus efficace au niveau de l'espace.

Systèmes de fichiers d'archivage Oracle HSM

Les systèmes de fichiers d'archivage associent un ou plusieurs systèmes de fichiers de type ma ou ms QFS à du stockage d'archive et au logiciel Oracle Hierarchical Storage Manager. Le logiciel Oracle HSM copie les fichiers du cache disque du système de fichiers vers un stockage sur disque secondaire et/ou des médias amovibles. Il gère les copies comme faisant partie intégrante du système de fichiers. Ainsi, le système de fichiers offre à la fois une protection continue des données et la possibilité de stocker de manière souple et efficace des fichiers extrêmement volumineux qui, autrement, pourraient être trop chers à stocker sur des disques ou des disques durs électroniques.

Un système Oracle HSM correctement configuré offre une protection continue des données sans applications de sauvegarde distinctes. Le logiciel copie automatiquement les données des fichiers lors de la création ou de la modification des fichiers, comme indiqué dans les politiques définies par les utilisateurs. Jusqu'à quatre copies peuvent être conservées sur des disques et des médias de bande, composés à la fois de ressources locales et de ressources distantes. Les métadonnées des systèmes de fichiers enregistrent l'emplacement du fichier et toutes les copies. Le logiciel propose toute une gamme d'outils permettant d'afficher rapidement la localisation de copies. Ainsi, les fichiers perdus ou endommagés peuvent être rapidement récupérés dans l'archive. Toutefois, les copies de sauvegarde sont conservées au format tar (archive sur bande) POSIX standard qui vous permet de récupérer des données même si le logiciel Oracle HSM n'est pas disponible. Oracle HSM assure en permanence la cohérence des métadonnées des systèmes de fichiers en détectant et en réparant dynamiquement les erreurs d'E/S. Vous pouvez donc récupérer un système de fichiers sans avoir à effectuer de contrôles d'intégrité chronophages, ce qui est extrêmement appréciable lorsque les données stockées se chiffrent en péta-octets et en centaines de milliers de fichiers. Si les métadonnées des systèmes de fichiers sont stockées sur des périphériques distincts consistant uniquement en des disques de stockage de données, la récupération est complète lorsque des disques de remplacement sont configurés dans le système de fichiers. Quand les utilisateurs demandent des fichiers qui se trouvaient sur un disque en échec, Oracle HSM transfère automatiquement les copies de sauvegarde de la bande au disque de remplacement. Si des métadonnées sont également perdues, un administrateur peut les restaurer à partir d'un fichier de sauvegarde samfsdump à l'aide de la commande samfsrestore. Une fois les métadonnées restaurées, les fichiers peuvent à nouveau être restaurés depuis la bande lorsque les utilisateurs les demandent. Les fichiers étant restaurés sur le disque à la demande uniquement, le processus de récupération utilise efficacement la bande passante et a un impact minimal sur les opérations normales.

Cette aptitude à gérer simultanément des fichiers sur des disques principaux et disques durs électroniques haute performance et sur des disques secondaires, bandes ou médias optiques à haute densité et moins onéreux fait des systèmes de fichiers Oracle HSM des systèmes idéaux pour stocker de manière économique des fichiers inhabituellement volumineux et/ou peu utilisés. Les fichiers de données très volumineux et peu utilisés, tels que les images satellite et les fichiers vidéo, peuvent uniquement être stockés sur bande magnétique. Quand des utilisateurs ou des applications accèdent à un fichier, le système de fichiers le retransfère automatiquement sur le disque ou le lit dans la mémoire directement depuis la bande, selon la configuration de fichier choisie. Les enregistrements qui sont principalement conservés à des fins historiques ou de conformité peuvent être stockés de façon hiérarchique, à l'aide du média qui correspond le mieux aux schémas d'accès et aux contraintes budgétaires de l'utilisateur à un moment donné de la vie du fichier. En premier lieu, lorsque les utilisateurs continuent à accéder occasionnellement à un fichier, vous pouvez archiver ce dernier sur des périphériques de disques secondaires moins onéreux. Lorsque la demande diminue, vous pouvez conserver des copies sur bande ou sur média optique uniquement. Cependant, lorsqu'un utilisateur a besoin de données (en réponse à une procédure judiciaire ou à un processus réglementaire par exemple), le système de fichiers peut automatiquement transférer les informations requises sur un disque principal dans un délai minimum, quasiment comme si elles s'y étaient toujours trouvées. Lorsque des procédures juridiques ou réglementaires le nécessitent, les systèmes de fichiers Oracle HSM peuvent être rendus compatibles WORM. Les systèmes de fichiers WORM prennent en charge les périodes de conservation des fichiers par défaut et personnalisables, l'immuabilité des données et des chemins, et la transmission des paramètres WORM aux sous-répertoires. L'intégrité des données à long terme peut être contrôlée à l'aide de la validation de média manuelle et/ou automatique.

Les systèmes de fichiers d'archivage sont gérés et entretenus à l'aide de quatre processus Oracle HSM de base :

Archivage

Le processus d'archivage copie les fichiers d'un système de fichiers vers les médias d'archivage réservés pour stocker les copies des fichiers actifs. Les médias d'archivage peuvent se composer de volumes de média amovible, tels que des cartouches de bande magnétiques et/ou un ou plusieurs systèmes de fichiers qui résident sur des disques magnétiques ou des disques durs électroniques de stockage. Les copies de fichiers d'archivage peuvent assurer une redondance de sauvegarde pour les fichiers actifs, la conservation à long terme des fichiers inactifs, ou les deux fonctions.

Dans un système de fichiers d'archivage Oracle HSM, les fichiers actifs en ligne, les copies d'archive et les ressources de stockage associées forment une ressource logique unique : le groupe d'archives. Tous les fichiers actifs d'un système de fichiers d'archivage appartiennent à un groupe d'archives, et un seul. Chaque groupe d'archives peut inclure jusqu'à quatre copies d'archive de chaque fichier ainsi que des stratégies qui contrôlent le processus d'archivage pour le groupe d'archives concerné.

Le processus d'archivage est géré par un démon UNIX (service) sam-archiverd. Le démon planifie les activités d'archivage et appelle les processus qui effectuent les tâches requises, archiver, sam-arfind, et sam-arcopy.

Le processus de l'archiveur lit les stratégies d'archivage dans un fichier de configuration modifiable, archiver.cmd, et configure les processus d'archivage restants comme spécifié. Les directives de ce fichier contrôlent le comportement général des processus d'archivage, définissent les groupes d'archives par système de fichiers et spécifient le nombre de copies effectuées et les médias d'archivage utilisés pour chacune d'entre elles.

Le démon sam-archiverd démarre ensuite le processus sam-arfind pour chaque système de fichiers actuellement monté. Le processus sam-arfind analyse le système de fichiers pour rechercher les fichiers nouveaux, modifiés, renommés ainsi que les fichiers à réarchiver ou à désarchiver. Par défaut, le processus analyse en permanence les modifications apportées aux fichiers et aux répertoires, car c'est la démarche qui permet d'obtenir les meilleures performances générales. Mais si vous devez assurer la compatibilité avec des implémentations StorageTek Storage Archive Manager plus anciennes, par exemple, vous pouvez modifier les règles des groupes d'archives dans le fichier archiver.cmd et planifier l'analyse à l'aide de l'une des méthodes proposées (reportez-vous à la page de manuel sam-archiverd pour plus d'informations).

Lorsqu'il a identifié des fichiers candidats, sam-arfind identifie le groupe d'archives qui définit les stratégies d'archivage du fichier. Le processus sam-arfind identifie le groupe d'archives en comparant les attributs du fichier aux critères de sélection définis par chaque groupe d'archives. Ces critères peuvent inclure un ou plusieurs des attributs de fichier suivants :

  • le chemin d'accès au répertoire du fichier et, en option, une expression régulière qui correspond à un ou plusieurs des noms des fichiers candidats ;

  • un nom d'utilisateur spécifié qui correspond au propriétaire d'un ou de plusieurs fichiers candidats

  • un groupe de noms spécifié qui correspond au groupe associé au fichier

  • une taille de fichier minimale spécifiée qui est inférieure ou égale à la taille du fichier candidat

  • une taille de fichier maximale spécifiée qui est supérieure ou égale à la taille du fichier candidat.

Lorsqu'il a trouvé le groupe d'archives correct et les paramètres d'archivage correspondants, sam-arfind vérifie si l'âge d'archivage du fichier est égal ou est supérieur au seuil spécifié par le groupe d'archives. L'âge d'archivage d'un fichier est le nombre de secondes qui se sont écoulées depuis que le fichier a été créé, modifié pour la dernière fois (par défaut) ou consulté pour la dernière fois. Si l'âge d'archivage correspond aux critères d'âge spécifiés dans la stratégie, sam-arfind ajoute le fichier à la file d'attente archive request du groupe d'archives et lui attribue une priorité. Les priorités sont basées sur les règles définies dans le groupe d'archives et sur des facteurs tels que le nombre de copies d'archive qui existent déjà, la taille du fichier, toutes les demandes d'opérateurs supplémentaires et toutes les autres opérations qui dépendent de la création d'une copie d'archive.

Lorsque sam-arfind a identifié les fichiers nécessitant archivage, leur a donné un ordre de priorité et les a ajoutés aux demandes d'archivage pour chaque groupe d'archives, il renvoie les demandes au démon sam-archiverd. Le démon compose chaque demande d'archivage. Il organise les fichiers de données en fichiers d'archive dimensionnés de manière à optimiser l'utilisation des médias et à permettre l'écriture, puis plus tard la récupération efficaces des fichiers sur et depuis les médias amovibles. Ce démon respecte tous les paramètres de tri de fichiers ou de restrictions de média que vous définissez dans le fichier archiver.cmd (reportez-vous à la page de manuel archiver.cmd pour plus d'informations), mais sachez que restreindre la capacité du logiciel à sélectionner librement des médias détériore généralement les performances et l'utilisation des médias. Lorsque les fichiers archive ont été assemblés, sam-archiverd hiérarchise les demandes d'archivage afin que le processus de copie puisse transférer le plus grand nombre de fichiers possible en un nombre d'opérations de montage aussi réduit que possible (reportez-vous à la section relative à la planification de la page de manuel sam-archiverd pour plus d'informations). Le processus sam-archiverd planifie les opérations de copie de manière à ce qu'à aucun moment elles ne requièrent plus de disques que le nombre maximum autorisé par les stratégies de groupes d'archives et/ou par la bibliothèque robotique.

Lorsque les demandes sont planifiées, sam-archiverd appelle une instance du processus sam-arcopy pour chaque demande d'archivage et disque planifiés. Les instances de sam-arcopy copient les fichiers de données vers des fichiers archive sur les médias d'archivage, mettent à jour les métadonnées des systèmes de fichiers d'archivage afin qu'elles reflètent l'existence des nouvelles copies et mettent à jour les journaux d'archive.

Lorsque le processus sam-arcopy s'arrête, le démon sam-archiverd contrôle la demande d'archivage pour détecter les éventuelles erreurs ou omissions dues à des erreurs de lecture depuis le disque de cache, à des erreurs d'écriture sur les volumes de média amovible et à des fichiers ouverts, modifiés ou supprimés. Si des fichiers n'ont pas été archivés, sam-archiverd recompose la demande d'archivage.

Les processus sam-arfind et sam-arcopy peuvent utiliser l'utilitaire syslog et archiver.sh pour créer un enregistrement continu de l'activité d'archivage, des avertissements et des messages d'information. Le journal d'archiveur qui en résulte contient des informations utiles de diagnostic et d'historique, notamment un enregistrement détaillé de l'emplacement et de la disposition de chaque copie de fichier archivé. Ainsi, par exemple, en cas de récupération après sinistre, vous pouvez souvent utiliser un journal d'archive pour récupérer les fichiers de données manquants qui seraient irrécupérables autrement (pour en savoir plus, consultez le Guide de récupération des systèmes de fichiers d'Oracle Hierarchical Storage Manager et du logiciel StorageTek QFS dans la Bibliothèque de documentation client). Les administrateurs du système de fichiers permettent la journalisation de l'archiveur et la définition de fichiers journaux à l'aide de la directive logfile= dans le fichier archiver.cmd. Pour plus d'informations sur le fichier journal, reportez-vous à la page de manuel archiver.cmd.

Transfert

Le processus de transfert recopie les données des fichiers du stockage d'archivage au cache du disque principal. Lorsqu'une application tente d'accéder à un fichier hors ligne (un fichier qui n'est pas actuellement disponible dans le stockage principal) une copie d'archive est automatiquement transférée (recopiée sur le disque principal). L'application peut alors accéder au fichier rapidement, avant même que la totalité des données n'aient été réécrites sur le disque car l'opération de lecture suit immédiatement l'opération de transfert. Si une erreur de média se produit ou si un volume de média spécifique est indisponible, le processus de transfert charge automatiquement la copie d'archive suivante disponible (le cas échéant) à l'aide du premier périphérique disponible. Ainsi, le transfert fait du stockage d'archivage un processus transparent pour les utilisateurs et les applications. Tous les fichiers paraissent disponibles sur le disque à tout moment.

Le comportement de transfert par défaut est idéal pour la plupart des systèmes de fichiers. Cependant, vous pouvez modifier les réglages par défaut en insérant ou en modifiant les directives d'un fichier de configuration /etc/opt/SUNWsamfs/stager.cmd. Vous pouvez également remplacer ces directives pour chaque répertoire ou fichier à partir de la ligne de commande. Pour accéder à de petits enregistrements dans des fichiers volumineux par exemple, vous pouvez décider d'accéder directement aux données depuis le média d'archivage sans transférer le fichier. La fonction de transfert associativevous permet également de transférer un groupe entier de fichiers associés si l'un des fichiers de ce groupe doit être transféré. Consultez les pages de manuel stage et stager.cmd pour obtenir plus d'informations.

Publication

Le processus de libération libère de l'espace dans le cache disque principal en supprimant les copies en ligne de fichiers précédemment archivés qui ne sont pas utilisés. Lorsqu'un fichier a été copié sur un média d'archivage tel qu'une archive de disque ou un volume de bande, il peut être transféré quand et si une application y accède. Par conséquent, il n'est pas nécessaire de le conserver dans le cache disque lorsque de l'espace est requis pour d'autres fichiers. En supprimant les copies inutiles du cache disque, la libération garantit qu'il reste de l'espace de stockage disponible dans le cache principal pour les fichiers nouvellement créés et activement utilisés, même si le système de fichiers augmente alors que la capacité de stockage principale reste inchangée.

La libération intervient automatiquement quand l'utilisation du cache dépasse la limite supérieure du contrôle du débit et reste au-dessus d'une limite inférieure du contrôle du débit, les deux seuils configurables que vous définissez quand vous montez le système de fichiers d'archivage. La limite supérieure du contrôle du débit garantit d'avoir toujours assez d'espace libre disponible, alors que la limite inférieure du contrôle du débit garantit qu'un nombre raisonnable de fichiers est toujours disponible en cache et que les opérations de montage de médias sont ainsi réduites au strict minimum nécessaire. Les valeurs habituelles sont 80 % pour la valeur supérieure et 70 % pour la valeur inférieure.

La libération par contrôle de débit à l'aide du comportement par défaut est idéale pour la plupart des systèmes de fichiers. Cependant, vous pouvez modifier les réglages par défaut en ajoutant ou en modifiant les directives d'un fichier de configuration, /etc/opt/SUNWsamfs/releaser.cmd. Vous pouvez également remplacer ces directives pour chaque répertoire ou fichier à partir de la ligne de commande. Par exemple, vous pouvez libérer partiellement des fichiers volumineux à accès séquentiel, afin que les applications puissent commencer à lire la partie des fichiers toujours conservée sur le disque pendant que l'autre partie est transférée depuis le média d'archivage. Consultez les pages de manuel release et releaser.cmd pour en savoir plus.

Recyclage

Le processus de recyclage libère de l'espace sur le média d'archivage en supprimant des copies d'archive qui ne sont plus utilisées. A mesure que les utilisateurs modifient les fichiers, les copies d'archive associées aux anciennes versions des fichiers finissent par expirer. L'outil de recyclage identifie les volumes de média qui contiennent la majorité des copies d'archive expirées. Si les fichiers expirés sont stockés sur un volume de disque d'archivage, le processus de recyclage les supprime. Si les fichiers se trouvent sur un média amovible comme, par exemple, un volume de bande, le recyclage réarchive sur un autre média toutes les copies restantes du volume cible qui n'ont pas expiré. Il appelle ensuite un script modifiable, /etc/opt/SUNWsamfs/scripts/recycler.sh, pour réitérer l'étiquetage du volume recyclé et l'exporter de la bibliothèque, ou exécuter d'autres actions définies par l'utilisateur.

Par défaut, le processus de recyclage ne s'exécute pas automatiquement. Vous pouvez configurer le fichier crontab de Solaris pour qu'il s'exécute à une heure adéquate. De même, vous pouvez l'appeler à tout moment depuis la ligne de commande à l'aide de la commande /opt/SUNWsamfs/sbin/sam-recycler. Pour modifier les paramètres de recyclage par défaut, modifiez le fichier /etc/opt/SUNWsamfs/archiver.cmd ou créez un fichier /etc/opt/SUNWsamfs/recycler.cmd distinct. Consultez les pages de manuel correspondantes pour plus d'informations.