Récupération après sinistre
Récupération totale après sinistre
Cette procédure vise à restaurer un cluster TPE global dans les scénarios suivants :
- Perte de tous les nœuds TPE (ou d'un nœud en mode autonome).
- Perte de quorum d'un cluster swarm Docker lorsque plus d'un nœud a échoué.
Avant de commencer la procédure de récupération, assurez-vous d'avoir une archive valide de sauvegarde TPE pour pouvoir restaurer vos données.
-
Installez le système d'exploitation sur le(s) serveur(s) nécessaire(s).
-
Refaites la création du cluster ThingPark Enterprise
AVERTISSEMENTUne limitation dans le processus de restauration entraîne la configuration du cluster à être restaurée mais non appliquée. Assurez-vous de configurer le nouveau cluster comme l'ancien.
Vous pouvez récupérer la configuration enregistrée avec la commande suivante :
tar -axf config.archive.tgz ./infra.yml -O -
Refaites la Configuration et Déploiement.
-
Connectez-vous à Cockpit.
-
Accédez au module de sauvegarde TPE.
-
Cliquez sur Restaurer.
-
Dans "Chemin source de restauration", définissez le chemin où est montée votre archive de sauvegarde TPE
-
Cliquez sur Suivant.
-
Sélectionnez la sauvegarde que vous souhaitez restaurer et cliquez sur Suivant.

-
Attendez que la restauration soit terminée.
Voici le résultat final attendu :

-
Cliquez sur Fermer.
-
Allez dans le module Cockpit de Configuration TPE, cliquez Enregistrer & Appliquer pour appliquer la configuration restaurée.
-
Pour terminer, allez dans le module Cockpit de Services TPE et vérifiez que tous les services sont en cours d'exécution et les nœuds TPE sont prêts.
Récupération de nœud haute disponibilité
Cette procédure cible la récupération d'un nœud d'un cluster TPE HA (échec matériel).
-
Installez le système d'exploitation.
-
Connectez-vous à l'un des nœuds TPE fonctionnels. Exécutez une commande ssh pour vous connecter au serveur :
ssh support@${IP_OR_HOSTNAME_OF_TPE} -p 2222 -
Supprimez le nœud perdu du Docker Swarm (ancienne référence de nœud) en exécutant les 2 commandes suivantes :
docker node demote <node_name>
docker node rm <node_name>Où
<node_name>doit être remplacé par "tpe-node1", "tpe-node2" ou "tpe-node3" suivant le nœud perdu. -
Effectuez la découverte du cluster TPE en exécutant le script suivant :
sudo tpe-cluster-discover -i -c '{"hosts": [ {"ip": "<IP address node1>", "hostname":"tpe-node1", "sup_pass": "<support_password>" }, {"ip": "<IP address node2>", "hostname":"tpe-node2", "sup_pass": "<support_password>" }, {"ip": "<IP address node3>", "hostname":"tpe-node3", "sup_pass": "<support_password>" }]}'Où :
<IP address node>doit être remplacée par l'adresse IP de chaque nœud.<support_password>doit être remplacé par le mot de passe de l'utilisateur support.
-
Connectez-vous à Cockpit (via un nœud en cours d'exécution, pas le nœud en réinstallation).
-
Allez dans le module de Services TPE, sous opérations du cluster TPE, cliquez sur Redéployer le cluster :

-
Vous êtes invité à confirmer le redéploiement du cluster :

-
Cliquez sur Confirmer.
-
Une fois le redéploiement du cluster effectué, allez dans le module de configuration TPE.
-
Cliquez sur Enregistrer & Appliquer.
-
Pour terminer, allez dans le module de Services TPE et vérifiez que tous les services sont en cours d'exécution et que les trois nœuds sont à l'état prêts.