Dépannage en périphérie de réseau Rover

Utilisez les informations de dépannage pour identifier et résoudre les problèmes courants qui peuvent survenir lors de l'utilisation du service d'infrastructure en périphérie de réseau Rover.

Généralités

Obtention d'Oracle Support

Si, après avoir examiné et utilisé ces conseils de dépannage, vous avez toujours besoin d'aide, ouvrez une demande de service pour votre problème. Voir Ouvrir un ticket de soutien pour plus d'informations.

L'appareil est à nouveau verrouillé

Les appareils du service d'infrastructure en périphérie de réseau Rover doivent les déverrouiller après chaque redémarrage et chaque cycle d'alimentation. Si le RED est verrouillé de manière inattendue, vérifiez que la connexion d'alimentation est stable et vérifiez s'il a été redémarré récemment. Vérifiez que la connexion d'alimentation est stable et que le périphérique de l'infrastructure en périphérie de réseau Rover n'a pas redémarré.

Aucune sortie de console série

Si vous avez connecté votre hôte de contrôle au port série de l'appareil en périphérie de réseau Rover avec le câble fourni, mais que vous ne voyez aucune sortie après avoir allumé l'appareil, vérifiez ces éléments :

L'URL de la console de l'appareil affiche un message "indisponible" ou "non approuvé"

La console de périphérique communique avec TLS/HTTPS sur le port 8015 de chaque appareil de l'infrastructure en périphérie de réseau Rover. Lorsque votre navigateur affiche un avertissement de sécurité indiquant que l'URL n'est pas disponible ou n'est pas une URL approuvée, assurez-vous que le certificat TLS est installé et approuvé sur leur ordinateur.

Si le certificat TLS de la console des périphériques n'est pas installé et approuvé sur votre ordinateur hôte, ajoutez le certificat TLS à partir de la console des périphériques à l'aide du navigateur à la collection porte-clés/certificats de votre ordinateur hôte et marquez-le comme approuvé. Dans les navigateurs tels que Chrome, Edge et Firefox, le certificat TLS se trouve dans la fenêtre du navigateur à gauche de l'URL. Consultez la documentation de votre navigateur pour plus d'informations sur le téléchargement du certificat.

Un message "indisponible" ou "non approuvé" peut également se produire si le système est partiellement arrêté. Par exemple, lors du redémarrage d'une mise à niveau du système ou lors du démarrage pour la première fois après une panne de courant. Pour aider à diagnostiquer si le problème est lié au certificat TLS ou à une panne de système, vérifiez s'il y a une bonne ou une mauvaise réponse au point d'extrémité https://<host>:12060/v1/tenants/orei dans le navigateur de l'opérateur ou à l'aide d'un outil tel que CURL. Si l'accès à ce point d'extrémité entraîne un avertissement de sécurité, vérifiez que le certificat TLS du périphérique de l'infrastructure en périphérie de réseau Rover est correctement installé et approuvé. Si le point d'extrémité expire ou renvoie une réponse autre que 200, le système peut connaître une interruption partielle.

Avertissement de sécurité du navigateur lors de l'accès à la console de l'appareil

La console de périphérique communique avec TLS/HTTPS sur le port 8015 d'un périphérique donné. Lorsque le navigateur de la console de l'appareil affiche un avertissement de sécurité, assurez-vous que le certificat TLS est installé et approuvé sur votre appareil de l'infrastructure en périphérie de réseau Rover. Si le certificat TLS de la console de périphérique n'est pas installé et approuvé sur l'ordinateur hôte, ajoutez le certificat TLS de la console de périphérique dans le navigateur à la collection de porte-clés/certificats de l'ordinateur hôte. Marquez-le comme étant digne de confiance. Dans les navigateurs tels que Chrome, Edge et Firefox, le certificat TLS se trouve dans la fenêtre du navigateur à gauche de l'URL. Consultez la documentation de votre navigateur pour plus d'informations sur le téléchargement du certificat.

"Service inconnu" lors de la création de politiques pour "service rover"

Si vous obtenez l'erreur "Service inconnu" lors de la création de politiques pour "service rover", vous devrez peut-être créer une location enfant dans Oracle Cloud Infrastructure. Pour plus d'informations sur cette fonction, voir Création d'une nouvelle location enfant dans la documentation sur Oracle Cloud Infrastructure.

Vous ne pouvez pas déverrouiller l'appareil

Problème

Vous entrez la phrase secrète de déverrouillage, mais l'appareil ne déverrouille pas.

Causes et résolutions possibles

La clé maître du périphérique peut être déchiquetée pour l'une des raisons suivantes :

Pour les appareils autoprovisionnés :

La seule façon de procéder à la récupération est d'exécuter Recover Key dans la console série, puis d'entrer la clé de récupération. La clé de récupération a été affichée lors de la configuration initiale du périphérique.

Si vous ne connaissez pas la clé de récupération, il n'y a aucun moyen de déverrouiller et de récupérer l'appareil. Vous devez retourner l'appareil. Voir Retour à Oracle d'appareils du service d'infrastructure en périphérie de réseau Rover.

Pour les appareils provisionnés par Oracle : Voir Récupération de votre appareil de l'infrastructure en périphérie de réseau Rover après avoir déchiqueté la clé principale.

Autoprovisionnement

Utilisez les sections suivantes pour résoudre les problèmes qui peuvent survenir lors de l'auto-provisionnement :

Collecte des journaux d'auto-provisionnement

Lors de l'utilisation de l'interface de configuration de base en périphérie de réseau Rover dans la console série, comme décrit dans Provisionner l'appareil en libre-service, vous pouvez collecter des journaux qui pourraient aider à diagnostiquer les problèmes.

  1. Dans le menu principal de l'interface de configuration de base en périphérie de réseau Rover, sélectionnez Opérations avancées.
  2. Sélectionnez Collecter les journaux.

    La sortie du journal s'affiche.

  3. Copiez et enregistrez la sortie BASE64 (texte entre des lignes ===) dans un fichier, puis envoyez le fichier au soutien technique d'Oracle.

Vérification des mises à jour de l'interface de configuration de base en périphérie de réseau Rover

L'interface de configuration de base en périphérie de réseau Rover est le nom de l'interface de console série qui vous permet d'auto-provisionner un appareil. La mise à jour de l'interface est facultative, sauf si Oracle vous le demande.

  1. Dans le menu principal de l'interface de configuration de base en périphérie de réseau Rover, sélectionnez Opérations avancées.
  2. Sélectionnez Vérifier les mises à jour logicielles de l'interface de configuration.

    Si une mise à jour est disponible, elle s'affiche.

  3. Si une mise à jour est disponible, sélectionnez-la pour mettre à niveau l'interface.

Impossible d'enregistrer l'appareil ou de terminer l'enregistrement

Problème

Vous obtenez une erreur lorsque vous essayez d'exécuter l'une des commandes suivantes.

  • 6) Register device to OCI
  • 7) Complete device registration

Erreur :

Checking OCI Connectivity...
 
OCI connectivity failure due to The required information to complete authentication was not provided or was incorrect.
Please obtain new Session token/Session private key and re-enter
3) Session token and 4) Session private key then retry 6) Register device to OCI
 
ERROR: Registration FAILED!

Causes et résolutions possibles

  • Votre jeton de session et votre clé privée de session ont expiré ou ne sont pas valides.

    Vérifiez que vous utilisez la clé privée appropriée.

    Utilisez l'interface de ligne de commande OCI pour générer un nouveau jeton de session sur votre ordinateur portable.

  • L'horloge du périphérique en périphérie de réseau Rover est désynchronisée avec l'horloge du serveur OCI.

    Retournez au menu Configure Networking et exécutez Check OCI server clock and device.

Code d'activation non valide

Problème

Vous obtenez une erreur lorsque vous exécutez Register device to OCI.

Erreur :

Checking OCI Connectivity...
Node name: node-1
Node shape: RED.2.56
..
OCI connectivity OK!
....
Failed: Register to OCI Failed!!! Invalid Activation Code
 
Registration failed. Please retry 6) Register device to OCI a few more times.
 
If the failure still exist, please collect logs and contact Oracle Support.

Causes et résolutions possibles

Le code d'activation est incorrect. Assurez-vous que le code d'activation est entré correctement. Un code d'activation ne peut être utilisé que sur l'appareil pour lequel il a été émis.

Le serveur TOTP ne correspond pas au client TOTP

Problème

Vous obtenez une erreur lorsque vous exécutez Complete device registration.

Erreur :

Complete Registration Failed!!! The server TOTP does not match client TOTP
 
Please refer to Rover User Guide to create a dynamic group and update the policy statement.
Unable to complete the registration. Please retry 7) Complete device registration

Causes et résolutions possibles

Vous n'avez peut-être pas de groupe dynamique requis ou la politique associée n'est pas configurée ou est incorrectement configurée dans votre location.

Dans votre location, assurez-vous que le groupe dynamique et la politique sont configurés. Voir Autoriser l'auto-provisionnement des appareils de l'infrastructure en périphérie de réseau Rover.

Mise à niveau de système

L'icône de chargement Mise à niveau du système continue de tourner

L'outil de mise à niveau du système conserve son état de chargement jusqu'à ce qu'une temporisation se produise, après quoi il indique que le statut de mise à niveau du système ne peut pas être déterminé. Cette temporisation survient le plus souvent lorsque les RED sont déconnectés d'Internet. La mise à niveau du système nécessite une connexion à OCI pour déterminer si une mise à niveau pour l'appareil RED est disponible.

Si votre appareil est déconnecté d'Internet, vous pouvez mettre à jour votre appareil à l'aide du processus de mise à niveau déconnecté. Pour plus d'informations, voir Mise à niveau du logiciel de l'appareil en périphérie de réseau Rover lors de la déconnexion.

Échec du processus de téléchargement de l'ensemble de mise à niveau du système

Vérifiez votre connexion Internet et appuyez sur Télécharger la mise à niveau pour tenter le téléchargement. Si le téléchargement échoue après plusieurs tentatives, communiquez avec le soutien technique d'Oracle pour obtenir de l'aide.

Réseau

L'intervalle d'adresses IP pour la configuration du groupe d'adresses IP publiques n'est pas soumis

Après avoir entré un intervalle d'adresses IP et appuyé sur Entrée, appuyez de nouveau sur Entrée sur la ligne d'entrée vide pour la soumettre. Si d'autres intervalles d'adresses IP sont requis, appuyez sur Entrée après chaque intervalle pour ouvrir une autre ligne d'entrée. Soumettre une ligne d'entrée vide comme dernière entrée pour tout soumettre. Pour annuler et revenir en arrière, cliquez sur Ctrl+C.

Impossible d'accéder aux points d'extrémité de service public (169.254.169.254 dans les ports 8015, 18336, etc.)

Assurez-vous que le pare-feu sur l'instance ne bloque pas l'intervalle d'adresses 196.254.0.0/16. Il est courant qu'une image exportée par OCI bloque l'intervalle d'adresses locales et de liens par défaut. Si tel est le cas, supprimez des paramètres de pare-feu la règle qui bloque les connexions à 196.254.0.0/16. Consultez la documentation de votre système d'exploitation concernant la procédure de configuration du pare-feu.

Stockage

Le manque d'espace de stockage disponible entraîne l'échec des opérations de volume par blocs

Le manque d'espace de stockage disponible peut entraîner l'échec des opérations de stockage par blocs. Libérez de l'espace en supprimant les ressources qui ne sont plus nécessaires, telles que les objets Object Storage, les volumes de démarrage et par blocs et les instances. Vérifiez régulièrement le stockage disponible de vos RED pour vous assurer que vous n'êtes pas à risque de manquer. Pour plus d'informations, voir Surveillance des appareils du service d'infrastructure en périphérie de réseau Rover.

Une capacité de stockage d'objets faible déclenche des avertissements et en lecture seule

Lorsque le système atteint 80 % de capacité utilisée, il déclenche un statut d'avertissement dans la page Surveillance. Lorsque le système atteint la capacité de 95 % utilisée, il passe en mode lecture seule et la page Surveillance affiche le statut du stockage d'objets Dégradé ou Avertissement.

Oracle recommande d'éviter d'exécuter des opérations d'écriture intensives lorsque le système fonctionne avec une capacité de 80 % utilisée. Si vous êtes à ou près de 80 %, transférez des données vers le nuage OCI jusqu'à ce que le système ait une capacité bien inférieure à 80 %.

Si le système dépasse le seuil de capacité utilisée de 95 %, il passe en mode lecture seule et les fonctionnalités de base (y compris le service de calcul et le service de stockage d'objets) sont limitées. Toutes les opérations de calcul, telles que les instances personnalisées, les volumes de démarrage et les volumes par blocs, ainsi que toutes les opérations de stockage d'objets sont suspendues. La suspension du système vous empêche d'écrire sur un périphérique de stockage lorsque la durabilité et la redondance ne peuvent pas être garanties.

Si aucun espace de stockage disponible ne reste sur l'appareil, vous pouvez libérer de l'espace en supprimant les ressources qui ne sont plus nécessaires, telles que les objets du service de stockage d'objets, les volumes de démarrage et par blocs et les instances. Si les demandes de suppression échouent car il ne reste plus d'espace de stockage et que le système est en mode lecture seule, vous pouvez activer le mode sans échec au moyen de la console série. Le mode sans échec vous permet d'effectuer les suppressions nécessaires.

Éviter de surabonner aux problèmes de stockage

Suivez les recommandations des meilleures pratiques sur la façon de configurer ou de planifier la consommation des ressources de calcul, de stockage par blocs et de stockage d'objets pour éviter les problèmes de surabonnement. Les services de stockage par blocs et de calcul ne réservent pas d'espace de stockage pour les volumes à l'avance. Au lieu de cela, l'espace de stockage est consommé lorsque les données sont écrites dans le volume. Par exemple, si un volume par blocs de 100 Go est créé, cela ne signifie pas que 100 Go sont réservés à partir de l'espace de stockage total disponible pour ce volume. L'espace de stockage reste disponible pour tous les services et peut être épuisé avant que le volume de 100 Go ne soit rempli de données.

De plus, les services de calcul et de stockage par blocs ne valident pas la taille spécifiée d'un volume créé par rapport à l'espace de stockage disponible. Ce manque de validation peut entraîner un surabonnement lorsque la taille totale des volumes créés dépasse l'espace de stockage disponible sur l'appareil. Ne comptez pas sur la taille des volumes par blocs pour calculer l'utilisation de l'espace de stockage. Suivez plutôt les informations sur l'utilisation de l'espace de stockage affichées dans la page Surveillance de la console de l'appareil.

La page de surveillance affiche le statut du stockage d'objets "Dégradé" ou "Avertissement"

Si la fonction de stockage présente un dysfonctionnement RED ou présente des problèmes physiques, la page Surveillance de la console de l'appareil peut afficher périodiquement le statut Avertissement ou Dégradé pour le service de stockage d'objets. Si cette situation se produit, le RED tente de rééquilibrer son stockage et de récupérer le niveau de redondance déclaré. Finalement, il montre un état sain si RED a de l'espace disponible et est capable de récupérer suffisamment de copies redondantes sur les périphériques RED restants utilisés pour le stockage.

L'importation d'images du stockage d'objets vers le service de calcul prend beaucoup de temps

Si une image n'apparaît pas dans la liste Images personnalisées, l'importation a échoué. Si l'importation échoue, consultez la page Détails des noeuds d'appareil :

  1. Ouvrez le menu de navigation et sélectionnez Gestion des noeuds > Noeuds. La page Noeuds s'affiche. Elle présente le statut des services et des fonctions de tous vos appareils du service d'infrastructure en périphérie de réseau Rover, sous forme de tableau.

  2. Sélectionnez le noeud dont vous voulez surveiller le statut et voir sa page Détails.

  3. Sélectionnez l'onglet Stockage et vérifiez le pourcentage de l'appareil de stockage utilisé.

Si le service de stockage d'objets n'est pas sain, la page Surveillance affiche Dégradée ou Avertissement comme statut. Si le service de stockage d'objets fonctionne, vérifiez la page Surveillance pour vous assurer qu'il y a suffisamment d'espace disponible. Si l'espace disponible est insuffisant, supprimez les images, objets, instances et autres éléments pour laisser de la place à l'image souhaitée.

Les objets avec certains ID version peuvent causer des problèmes

L'exécution d'une commande d'interface de ligne de commande où l'ID version de l'objet commence par un tiret ("-") et contient les caractères h ou i entraîne l'entrée en mode interactif de l'interface de ligne de commande. Par exemple :
oci os object get ... --version-id '-WhjCQ.-IYgDLuoZ9gbxpn.8Q.q-iZt' ...

Si cela se produit, vous pouvez utiliser l'une des solutions de rechange suivantes :

  • Incluez le signe égal ("=") entre le paramètre --version-id et sa valeur. N'insérez pas d'espaces avant le =. Par exemple :

    oci os object get ... --version-id="-WhjCQ.-IYgDLuoZ9gbxpn.8Q.q-iZt" ...

    Utilisez uniquement des guillemets doubles autour de la valeur.

  • Incluez le paramètre --from-json dans la commande et spécifiez l'entrée dans un format JSON. Pour plus d'informations, voir Options JSON avancées.

Compute/Instances

La tentative de création d'instance entraîne le message "Hors capacité"

La capacité de l'instance est limitée par le nombre de coeurs et de mémoire disponibles. Mettez fin à certaines instances existantes qui ne sont pas en cours d'utilisation et réessayez. Les instances arrêtées sont prises en compte dans le calcul des ressources utilisées.

Échec de l'importation de l'image

L'importation d'images volumineuses prend un certain temps, beaucoup plus longtemps si d'autres applications ou opérations sur disque sont en cours. Si une importation prend trop de temps et que vous voulez y mettre fin, sélectionnez Mettre fin dans le menu Importer. Une importation d'image expirera automatiquement après quatre heures.

L'instance passe à l'état En cours d'exécution, mais lors de la connexion en boucle sur certains messages de démarrage

L'infrastructure en périphérie de réseau Rover prend uniquement en charge les images .oci et .qcow2, avec le démarrage de l'UEFI. Pour rechercher les problèmes liés aux images, ouvrez la console des périphériques et accédez à la page Détails de l'instance de calcul. Vérifiez si le format de l'image est .oci, .qcow2 ou un autre type. Les images exportées à partir du nuage OCI sont généralement de type .oci. Confirmez l'image et le type de démarrage avec le fournisseur de l'image.

Sur un ordinateur Linux, utilisez l'utilitaire qemu-img pour voir les informations sur l'image à l'aide de la commande suivante :

qemu-img info image_file

Impossible d'accéder à la ressource externe à partir d'une instance

  1. Si le nom de domaine référence une ressource externe, assurez-vous que les résolveurs DNS externes sont ajoutés à la liste des serveurs de noms dans l'instance. Consultez la documentation de votre système d'exploitation concernant la procédure de configuration DNS.

    Par exemple, sur certains systèmes Linux, des adresses IP de serveur de noms doivent être ajoutées au fichier /etc/resolv.conf.

  2. Assurez-vous que les paramètres de connectivité externe RED sont corrects. Voir Administration des appareils au moyen de la console série
  3. Assurez-vous que les paramètres du pare-feu d'instance ne bloquent pas les connexions sortantes. Consultez la documentation de votre système d'exploitation concernant les procédures de configuration du pare-feu.

Connexion à une instance impossible à l'aide de SSH

  1. Assurez-vous que l'instance est en cours d'exécution. Ouvrez la console de l'appareil et vérifiez la page Détails de l'instance de calcul pour vous assurer que l'état de l'instance est RUNNING. Si l'instance n'est pas en cours d'exécution, entrez Démarrer pour lancer l'instance. Attendez que l'état passe à RUNNING.

  2. Assurez-vous que l'adresse IP publique de l'instance est affectée. Ouvrez la console de l'appareil et allez à la page Détails de l'instance de calcul. Sélectionnez le nom de l'instance et vérifiez qu'une adresse IP publique est affectée à l'instance en consultant la valeur Adresse IP publique sous la section Accès à l'instance.

    Si aucune adresse IP publique n'est affectée à l'instance, ajoutez-en une à l'aide des étapes suivantes :

    1. Ouvrez la page Détails de l'instance de calcul.

    2. Sélectionnez Cartes vNIC attachées sous Ressources pour afficher la liste des cartes vNIC attachées.

    3. Sélectionnez la carte VNIC principale.

    4. La page Détails de la carte VNIC principale s'affiche.

    5. Sélectionnez Modifier.

      Vous pouvez également sélectionner le menu Actions (Menu Actions) de la carte VNIC à modifier, puis sélectionner Modifier.

      La boîte de dialogue Modifier la carte vNIC s'affiche.

    6. Sélectionnez l'option Adresse IP publique éphémère.

    7. Sélectionnez Mettre à jour.

    8. Si l'affectation d'adresse IP publique échoue, ouvrez la console série et sélectionnez Configuration du réseau pour vous assurer que le groupe d'adresses IP publiques du réseau RED est configuré et que des adresses IP sont disponibles.

  3. Assurez-vous que les paramètres de connectivité externe RED sont corrects. Ouvrez la console série et sélectionnez Configuration d'appareils. Assurez-vous que l'adresse IP du RED, la longueur du préfixe réseau et l'adresse IP de la passerelle sont configurées correctement.

  4. Assurez-vous que l'instance est accessible au moyen de demandes ICMP. Exécutez la commande suivante :

    ping 100.100.1.10

    100.100.1.10 est l'adresse IP publique de l'instance cible. Si la commande réussit, le problème peut être lié à la configuration d'instance (service SSH, règles de pare-feu). Consultez la documentation de votre système d'exploitation concernant la configuration de SSH et de pare-feu pour plus d'informations.

  5. Assurez-vous que l'instance a démarré correctement. Si l'exécution de la commande ping 100.100.1.10 échoue, vérifiez l'historique de la console d'instance pour rechercher une séquence de démarrage réussie. Voir Saisie de l'historique de la console pour l'infrastructure en périphérie de réseau Rover.

  6. Redémarrez le noeud à l'aide du bouton d'alimentation de l'appareil ou à l'aide de la console série.

Impossible d'accéder à un port sur une instance à partir de l'ordinateur externe

  1. Assurez-vous que les paramètres de connectivité externe RED sont corrects. Voir Administration des appareils au moyen de la console série.

  2. Assurez-vous que les paramètres du pare-feu d'instance ne bloquent pas les connexions entrantes. Consultez la documentation de votre système d'exploitation concernant la procédure de configuration du pare-feu.

  3. Assurez-vous que l'adresse IP publique accède à l'instance, et non à l'adresse IP privée ou au nom de domaine complet. L'adresse IP privée de l'instance est visible uniquement dans le sous-réseau VCN. Le nom de domaine complet de l'instance n'est visible que lorsque le service DNS interne du VCN par défaut est utilisé (169.254.169.254), qui n'est pas accessible en dehors du réseau VCN.

Impossible d'accéder à une instance à partir d'une autre instance

  1. Assurez-vous que l'instance cible est en cours d'exécution. Ouvrez la console de l'appareil et vérifiez la page Détails de l'instance de calcul pour vous assurer que l'état de l'instance cible est En cours d'exécution.

  2. Assurez-vous que la configuration réseau de l'instance d'envoi de demande, telle que l'adresse IP, le masque de réseau et la passerelle, est correcte. Suivez les directives relatives aux paramètres du sous-réseau lors de l'exécution de la configuration. Pour plus d'informations, consultez la documentation relative à la configuration réseau de votre système d'exploitation.

    Sur des systèmes Linux, vérifiez la configuration à l'aide de la commande suivante :

    ip addr show ip route show default
  3. Assurez-vous que les paramètres du pare-feu de l'instance cible ne bloquent pas les connexions entrantes. Pour plus d'informations, consultez la documentation de votre système d'exploitation concernant la procédure de configuration du pare-feu.

  4. Assurez-vous que les paramètres de pare-feu d'instance d'envoi de demande ne bloquent pas les connexions sortantes. Consultez la documentation de votre système d'exploitation concernant la procédure de configuration du pare-feu.

  5. Si ICMP n'est pas bloqué sur l'instance cible, assurez-vous que la commande ping a réussi. Exécutez la commande suivante à partir de l'interpréteur de commandes de l'instance qui envoie la demande :

    ping 10.0.0.2

    10.0.0.2 est l'adresse IP privée de l'instance cible.

  6. Si le résultat de la commande ping est No route to host, assurez-vous que la route par défaut est réglée à la passerelle de sous-réseau. Consultez la documentation de votre système d'exploitation concernant les paramètres de routage par défaut. Par exemple, pour les systèmes d'exploitation basés sur Linux, la commande peut être :

    ip route show default

    avec la sortie attendue :

    default via 10.0.0.1 dev eth0

    10.0.0.1 est l'adresse IP de la passerelle du sous-réseau 10.0.0.0/24 (la passerelle du sous-réseau VCN utilise toujours la première adresse dans l'intervalle de sous-réseaux).

Impossible d'accéder à une autre instance à l'aide d'un nom de domaine complet

Assurez-vous que l'instance cible est en cours d'exécution. Ouvrez la console de l'appareil et vérifiez la page Détails de l'instance de calcul pour vous assurer que l'état de l'instance cible est En cours d'exécution. Si l'instance cible est Arrêtée, redémarrez-la. Vérifiez que 169.254.169.254 est défini comme serveur de noms pour l'instance qui envoie la demande. Consultez la documentation de votre système d'exploitation concernant la procédure de configuration DNS pour toute question.

L'instance est lancée, mais il n'y a pas d'adresse IP publique à laquelle se connecter à l'aide de SSH

Lors de la création d'une instance, sélectionnez l'option Affecter une adresse IP publique. Assurez-vous que le groupe d'adresses IP publiques spécifié lors de la configuration de l'appareil (à l'aide de la console série) a suffisamment d'adresses pour le nombre d'instances (y compris celles dont l'état est Arrêté). S'il n'y a pas assez d'adresses, mettez fin à certaines instances pour libérer des adresses ou créez-en d'autres à l'aide de la console série.

La création d'instance passe directement à l'état Interruption

Cela est probablement dû à l'une des raisons suivantes :

  • Manque d'adresses IP publiques : Le manque d'adresses IP peut survenir en raison du fait que le groupe d'adresses IP publiques n'est pas configuré dans la console série ou qu'il n'est plus disponible pour une autre raison indéterminée. Vérifiez que l'intervalle de groupes d'adresses IP publiques RED a été défini (en cas de création d'une instance avec l'option par défaut d'adresse IP publique) :

    1. Ouvrez la console série.

    2. Sélectionnez Configurer le réseau (option 3).

    3. Sélectionnez Afficher le statut du groupe d'adresses IP publiques (option 4).

    Si le groupe d'adresses IP publiques n'a pas été défini, revenez en arrière et sélectionnez Intervalle de groupes d'adresses IP publiques pour les instances de calcul. Suivez les instructions affichées pour entrer des intervalles d'adresses IP publiques. La console série comprend un guide d'utilisation pour plus d'informations.

  • Stockage par blocs/objet Ceph complet : L'impossibilité d'affecter de l'espace pour le volume de démarrage de l'instance peut entraîner l'entrée de l'état Arrêt de l'instance. Assurez-vous que le stockage d'objets/blocs n'est pas plein en consultant le haut de la page Monitoring dans la console RED.

  • Utilisation d'UC complète : Il existe un maximum de 32 OCPU au total pour toutes les instances, y compris les OCPU arrêtées. Dans la page Compute de la console des périphériques, assurez-vous que le nombre total d'OCPU des instances existantes est inférieur au nombre maximal de 32. Si les 32 OCPU sont utilisées, mettez fin à certaines instances pour libérer des ressources.

  • Utilisation complète des GPU : Il existe un maximum d'une instance en forme de GPU, y compris les GPU arrêtés. Un RED ne peut avoir qu'une seule instance en forme de GPU provisionnée à la fois. Les tentatives de création d'instances de forme GPU supplémentaires s'arrêtent lors du provisionnement. Dans la page Calcul de la console de l'appareil, assurez-vous qu'il n'y a aucune instance avec une forme de processeur graphique à l'état En cours d'exécution ou Arrêté. Si une instance en forme de GPU existe, mettez fin à celle-ci.

  • Image non valide : Le service d'infrastructure en périphérie de réseau Rover prend uniquement en charge les formats d'image .oci et .qcow2, avec le démarrage de l'UEFI. Dans la page Calcul de la console de l'appareil, ouvrez la section Instances et déterminez l'instance qui se termine. Sélectionnez l'instance de fin pour ouvrir la page Détails, dans laquelle vous pouvez noter le nom de l'image. Le nom et l'extension de l'image indiquent s'il s'agit de .oci, .qcow2 ou d'un autre type. Les images exportées à partir du nuage OCI sont généralement de type .oci. Vérifiez l'image et le type de démarrage avec la personne qui a fourni l'image.

    Sur un ordinateur Linux, utilisez l'utilitaire qemu-img pour voir les informations sur l'image à l'aide de la commande suivante :

    qemu-img info image_file

Performance d'instance lente ou utilisation de terminal lente à l'aide de SSH

Des performances RED lentes peuvent se produire lorsque d'autres instances sont très utilisées, telles que celles qui exécutent des applications exigeantes en disque ou en réseau. Les opérations impliquant de gros volumes de ressources, telles que l'importation de contenus volumineux dans le stockage d'objets ou d'images de calcul, peuvent également nuire aux performances. Si vous travaillez avec une application intensive, utilisez une forme d'instance avec un nombre d'OCPU supérieur, car elle fournit également plus de mémoire vive. Arrêtez ou arrêtez l'instance courante, puis créez une autre instance à l'aide de la même image, mais avec la forme la plus grande.

Votre instance passe à l'état En cours d'exécution, mais SSH rejette votre clé, refuse la connexion ou expire.

Si vous lancez une instance dont l'état est En cours d'exécution, mais que SSH rejette votre clé, refuse la connexion ou expire, essayez ce qui suit :

  • Assurez-vous d'essayer de vous connecter à l'adresse IP publique de l'instance à l'aide de SSH.

  • Assurez-vous d'utiliser la clé privée (non publique) dans le cadre de la commande SSH sur votre ordinateur hôte.

  • Accordez une minute ou plus au lancement complet de l'instance. Cette heure permet au service SSH de se charger. Réessayez de vous connecter.

  • Dans de rares cas, si l'image que vous avez chargée ou importée contient déjà des clés SSH d'utilisateur public, les nouvelles clés chargées ou copiées/collées dans le cadre du processus de création d'instance peuvent ne pas être incluses. Prenez un instantané de l'image d'origine avec les clés souhaitées ajoutées et utilisez cette image modifiée.

Instance bloquée pendant longtemps

Le provisionnement de certaines images et ressources, telles que des volumes de démarrage, des processeurs graphiques et des formes plus volumineuses, peut prendre 10 minutes ou plus. Si une instance est bloquée depuis longtemps, procédez comme suit :

  1. Accédez à la console de l'appareil et ouvrez la page Détails de l'instance.

  2. Consultez les sections Volumes par blocs attachés et Cartes vNIC attachées et notez toutes les ressources bloquées à l'état Attachement ou Détachement.

  3. Si des volumes par blocs ou des cartes vNIC sont bloqués à l'état Attachement/Détachement, consultez la page Surveillance pour voir si les services de stockage par blocs et de VCN sont sains.

    • Si l'espace de stockage utilisé est presque plein, la capacité peut ne pas être suffisante pour provisionner une instance. Envisagez de mettre fin à d'autres instances, de supprimer des volumes par blocs ou les deux pour libérer de l'espace.

    • Si le groupe d'adresses IP publiques est utilisé, il n'est pas possible de provisionner une nouvelle instance avec une adresse IP publique (spécifiée par défaut). Mettez fin aux instances existantes pour libérer des adresses IP ou ajoutez des adresses IP publiques à l'aide de la console série.

  4. Vérifiez dans la page Monitoring que les autres services ne sont pas sains.

Si les solutions énumérées ici ne résolvent pas le problème, envisagez de mettre fin à l'instance.

Les instances bloquées seront effacées automatiquement après quelques heures, sinon elles pourraient devoir être arrêtées manuellement.

Synchronisation de données

Échec de la création de la tâche avec l'erreur "Tâche identique ou circulaire existante"

Les tâches de synchronisation de données sont unidirectionnelles et sont sensibles aux références circulaires. Vous ne pouvez pas configurer une synchronisation bidirectionnelle à l'aide de deux tâches et des mêmes seaux de stockage d'objets utilisés par OCI et les appareils RED. Assurez-vous que la tâche que vous créez ne tente pas d'inverser la direction de synchronisation d'une tâche précédemment créée. Si c'est le cas, modifier l'une des tâches ne doit pas inverser la direction de l'autre.

Les tâches sont spécifiées, mais les opérations de synchronisation ne démarrent pas

Data Sync nécessite d'affecter une connexion pour chaque appareil RED à un emplacement en nuage OCI où les opérations de synchronisation de données doivent se produire. Vérifiez la page de statut OCI pour voir si les services OCI sont en cours d'exécution. Si des problèmes de réseau ou de stockage d'objets se produisent, résolvez ces problèmes avant de tenter d'exécuter ou de programmer une synchronisation de données. Ensuite, vérifiez si le réseau local dispose d'une connectivité en exécutant ping OCI à partir de la machine hôte pour vérifier la connectivité entre l'infrastructure en périphérie de réseau Rover et OCI. Si la commande ping OCI ne fonctionne pas, vérifiez qu'il n'existe aucun pare-feu ou règle de réseau bloquant la connectivité.

Si vous créez une tâche de synchronisation de données pour synchroniser un seau de RED-à-OCI ou OCI-à-RED et que son temps d'exécution estimatif est supérieur à 12 heures, la tâche de synchronisation de données échoue exactement après 12 heures, car le jeton d'authentification expire toutes les 12 heures. Si la tâche de synchronisation de données échoue après plus de 12 heures d'exécution, procédez comme suit :

  1. Ouvrez le menu de navigation et sélectionnez Synchronisation de données.

    La page Tâches de synchronisation de données s'affiche. Toutes les tâches de synchronisation de données sont présentées sous forme de tableau.

  2. Vérifiez la tâche de synchronisation des données qui a échoué.

  3. Sélectionnez Démarrer.

    Vous pouvez également sélectionner le menu Actions (Menu Actions) pour la tâche de synchronisation de données que vous avez cochée et sélectionner Démarrer

  4. Confirmez le démarrage à l'invite.