Récupération de cluster Galera
TPE-HA : Mariadb/Galera ne peut pas se lancer
Si le cluster MariaDB reste arrêté après une perturbation (tous les nœuds TPE sont arrêtés) et que le conteneur SQL sur tpe_node1 ou tpe_node2 redémarre toujours avec ce type de log :
[support@tpe-node1 ~]$ docker logs -f $(docker ps -q --filter name=sql_node)
[...]
INFO: Reporting seqno: -1 to Zookeeper store.
[...]
ERROR: A unaivalable node have backuped a higher seqno, can't bootstrap.
SOLUTION :
Suivez l'étape suivante pour récupérer en réamorcant le cluster.
Récupérer le seqno pour sql_node1 et sql_node2 en utilisant :
[support@tpe-node1 ~]$ docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain get /galera/tpe/nodes/sql_node1/seqno
Connecting to localhost:2181
WATCHER::
WatchedEvent state:SyncConnected type:None path:null
1645
Le seqno est 1645 pour ce nœud sql_node1.
Et :
[support@tpe-node1 ~]$ docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain get /galera/tpe/nodes/sql_node2/seqno
Connecting to localhost:2181
WATCHER::
WatchedEvent state:SyncConnected type:None path:null
1643
Le seqno est 1643 pour ce nœud sql_node2.
Le cluster doit être amorcé avec le nœud ayant le seqno le plus élevé :
Si ce nœud est le sql_node1 :
docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot ""
docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot/node sql_node1
Sinon :
docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot ""
docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot/node sql_node2
Le cluster Galera redémarre.
La procédure de mise à jour échoue avec le message "l'image TPE actuelle n'est plus présente"
SYMPTÔME : Si la procédure de mise à jour de TPE échoue avec l'erreur suivante :
NOTE : This error may append when the current TPE image is not present anymore on TPE host.
For more details, please consult the TPE documentation.
SOLUTION :
La solution est de refaire un redéploiement (Service TPE -> Opérations du cluster TPE -> Redéployer le cluster)