Passer au contenu principal

Récupération de cluster Galera

TPE-HA : Mariadb/Galera ne peut pas se lancer

Si le cluster MariaDB reste arrêté après une perturbation (tous les nœuds TPE sont arrêtés) et que le conteneur SQL sur tpe_node1 ou tpe_node2 redémarre toujours avec ce type de log :

[support@tpe-node1 ~]$ docker logs -f $(docker ps -q --filter name=sql_node)
[...]
INFO: Reporting seqno: -1 to Zookeeper store.
[...]
ERROR: A unaivalable node have backuped a higher seqno, can't bootstrap.

SOLUTION :

Suivez l'étape suivante pour récupérer en réamorcant le cluster.

Récupérer le seqno pour sql_node1 et sql_node2 en utilisant :

[support@tpe-node1 ~]$ docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain get /galera/tpe/nodes/sql_node1/seqno
Connecting to localhost:2181

WATCHER::

WatchedEvent state:SyncConnected type:None path:null
1645

Le seqno est 1645 pour ce nœud sql_node1.

Et :

[support@tpe-node1 ~]$ docker exec $(docker ps -q -f 'name=zk_node') java  -Xmx256m org.apache.zookeeper.ZooKeeperMain get /galera/tpe/nodes/sql_node2/seqno
Connecting to localhost:2181

WATCHER::

WatchedEvent state:SyncConnected type:None path:null
1643

Le seqno est 1643 pour ce nœud sql_node2.

Le cluster doit être amorcé avec le nœud ayant le seqno le plus élevé :

Si ce nœud est le sql_node1 :

docker exec $(docker ps -q -f 'name=zk_node') java  -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot ""
docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot/node sql_node1

Sinon :

docker exec $(docker ps -q -f 'name=zk_node') java  -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot ""
docker exec $(docker ps -q -f 'name=zk_node') java -Xmx256m org.apache.zookeeper.ZooKeeperMain create /galera/tpe/forceboot/node sql_node2

Le cluster Galera redémarre.

La procédure de mise à jour échoue avec le message "l'image TPE actuelle n'est plus présente"

SYMPTÔME : Si la procédure de mise à jour de TPE échoue avec l'erreur suivante :

NOTE : This error may append when the current TPE image is not present anymore on TPE host.
For more details, please consult the TPE documentation.

SOLUTION :

La solution est de refaire un redéploiement (Service TPE -> Opérations du cluster TPE -> Redéployer le cluster)