Fonctionnalités de récupération
Les actions de récupération décrites ci-après sont automatiquement initiées en cas d’échec
dans le système de traitement distribué Apple Qmaster. En tant qu’administrateur, vous
n’avez pas besoin d’activer ou de configurer ces fonctionnalités.
Si un service s’arrête de manière inattendue
Si le service de contrôleur de clusters ou le traitement activé sur un nœud de service
s’arrête de manière inattendue, le système de traitement distribué Apple Qmaster
redémarre ce service. Pour éviter tout risque d’arrêt et de redémarrage incessants, le
système redémarre le service en échec quatre fois, au maximum. Les deux premières fois,
il redémarre le service immédiatement. Si le service s’interrompt brusquement une
troisième ou une quatrième fois, le système ne redémarre ce service que si il a fonctionné
au moins 10 secondes avant de s’arrêter.
Si un lot est interrompu
Lorsqu’un service s’arrête soudainement pendant le traitement d’un lot Apple Qmaster,
le contrôleur de clusters renvoie le lot interrompu de façon à empêcher le retraitement
des éventuels segments du lot terminés avant l’arrêt du service. Le contrôleur de clusters
retarde le renvoi du lot pendant environ une minute à partir de l’instant où il perd le
contact avec le service.
Si un lot échoue
Lorsque le service est en cours d’exécution, mais que le traitement d’un lot échoue, une
exception de service se produit. Dans ce cas, le contrôleur de clusters soumet à nouveau
le lot sans délai. Le contrôleur procède à une nouvelle soumission du lot deux fois, au
maximum. Si la tâche échoue lors du troisième envoi, le système de traitement distribué
arrête le renvoi de la tâche. Dans Share Monitor, l'état de la tâche est réglé sur Échec.