j'ai compris

[Partage d'initié] Dépannage du problème de basculement iStack.

publié il y a  2020-4-29 00:05:45 57 0 0 0 0

Salut les gars,

Récemment, j'ai rencontré un problème lié à la fonctionnalité de basculement iStack. Comme vous le savez, iStack est une fonctionnalité de fiabilité d'entreprise très courante qui est beaucoup utilisée dans les réseaux d'entreprise, je voudrais donc profiter de cette occasion pour partager cela avec vous. Afin de nous assurer que nous sommes sur la même page, je vais d'abord présenter quelques concepts de base d'iStack, puis nous irons plus loin avec le boîtier.

[Partage d'initié] Résolution du problème de basculement iStack.-1050995-1

Les commutateurs qui ont rejoint une pile sont des commutateurs membres. Chaque commutateur de membre dans une pile joue l'un des rôles suivants:
  • Interrupteur principal

    Le commutateur principal gère la pile entière. Une pile n'a qu'un seul commutateur principal.

  • Interrupteur de veille

    Le commutateur de secours est une sauvegarde du commutateur principal. En cas de défaillance du commutateur principal, le commutateur de secours prend en charge tous les services du commutateur principal. Une pile n'a qu'un seul commutateur de secours.

  • Commutateur esclave

    Un commutateur esclave transfère le trafic de service. Plus il y a de commutateurs esclaves dans une pile, plus les performances de transfert peuvent être élevées. Hormis les commutateurs maître et de secours, tous les autres commutateurs d'une pile sont des commutateurs esclaves.

Maintenant, je reviens à l'affaire. L'objectif principal était d'effectuer une mise à niveau sans avoir aucun impact sur le réseau, le client prévoyait donc de redémarrer chaque membre de la pile séparément. Le système était composé de 2 maîtres CE7850-32Q-EI et de secours.

La première opération, le redémarrage du périphérique de secours s'est bien déroulée sans aucune interruption. Mais la deuxième étape, le redémarrage du maître, génère une panne totale car le système de pile entier redémarre de manière inattendue. Qu'est-ce qui pourrait mal se passer?

Afin de comprendre ce qui se passe réellement, nous devons faire un petit retour en arrière et vérifier la journalisation de l'opération telle qu'elle était à ce moment précis. Je partagerai avec vous la meilleure façon de collecter tous les journaux possibles que le système Cloud Engine peut générer afin de revenir sur un problème dans le passé.

      

<HUAWEI> save logfile //Collect common user log file log.log.

<HUAWEI> system-view

[~HUAWEI] diagnose

[~HUAWEI-diagnose] save logfile diagnose-log //Collect diagnostic log file

diag.log generated when the device is running.

[~HUAWEI-diagnose] collect diagnostic information

After running the above commands, you download by FTP all the files found in the logfile folder from the flash of both devices ( on the master the path is flash:/logfile / and on the slave the path is slave:/flash:/logfile/ ) .

Example:
<R7_U18_CE6850>dir                                                                                                                 
Directory of flash:/                                                                                                               
                                                                                                                                   
  Idx  Attr     Size(Byte)  Date        Time       FileName                                                                        
    0  drwx              -  Oct 01 2015 19:52:00   $_checkpoint                                                                    
   13  drwx              -  Oct 05 2015 03:17:30   logfile 
<R7_U18_CE6850>cd logfile   
<R7_U18_CE6850>dir                                                                                                                 
Directory of flash:/logfile/                                                                                                       
                                                                                                                                   
  Idx  Attr     Size(Byte)  Date        Time       FileName                                                                        
    0  -rw-      6,128,295  Oct 05 2015 03:17:30   diag.log                                                                        
    1  -rw-        470,275  Jul 17 2015 14:39:48   diaglog_1_20150717153947.log.zip                                                
    2  -rw-        563,056  Sep 05 2015 03:25:46   diaglog_1_20150905032545.log.zip                                                
    3  -rw-        526,418  Aug 12 2015 21:28:27   diaglog_2_20150812212827.log.zip                                                
    4  -rw-        167,785  Oct 05 2015 03:17:30   diagnostic_information.zip                                                      
    5  -rw-      2,420,941  Oct 05 2015 03:21:16   log.log  


 

La vérification des informations de journalisation a montré quelques informations utiles, le temps entre les événements de slot 1 et de slot 2 est trop court, moins de 5 minutes, ce qui rend la synchronisation de basculement impossible.

 Temps de réinitialisation de l'emplacement 1:
7 janvier 2016 18:57:35 xxxxx %% 01CLI / 5 / CMDRECORD (s): CID = 0x80ca2716; informations de commande enregistrées. (Tâche = VTY0, Ip = xxxx VpnName = _public_, User = xxxxx, AuthenticationMethod = "Local-user", Command = "reset slot 1".)

Slot 2 reset time:
7 jan 2016 19:02:16 xxxxx %% 01CLI / 5 / CMDRECORD (s): CID = 0x80ca2713; informations de commande enregistrées. (Tâche = VTY0, Ip = xxxx, VpnName = _public_, User = xxxxx AuthenticationMethod = "Local-user", Command = " reset slot 2".

 

De plus, dans le journal de session, nous avons vu que le client n'avait pas vérifié l'état de basculement. Généralement, si l'état de basculement n'est pas prêt, le basculement échouera et le caractère de fiabilité de cette fonction ne pourra pas être utilisé en conséquence. Vérifiez ci-dessous à quoi devrait ressembler le statut:

 <HUAWEI> afficher l'état de basculement État de basculement
   :  prêt
   Politique de
   basculement: basculement de carte MainBoard: 1
   SlaveBoard: 2

En fait, le système vous avertit avant de redémarrer le système:

 7 janvier 2016 18:57:37 xxxxx %% 01CLI / 5 / INTER_CMDRECORD (s): CID = 0x80ca2716; informations de commande enregistrées. (Tâche = VTY0, Ip = ssss, VpnName = _public_, User = xxxxx Command = "reset slot 1", PromptInfo = "Avertissement: la réinitialisation de la carte dans l'emplacement 1 peut entraîner un redémarrage du système alors que l'état de basculement n'est pas prêt. Continuer? [ O / N]: ", UserInput =" Y ".)

La conclusion de ce cas est de toujours lire attentivement le guide / la documentation de mise à niveau avant de commencer toute opération et si vous avez des problèmes avec la compréhension de certaines opérations, n'hésitez pas à contacter le TAC pour obtenir de l'aide.

J'espère que vous trouverez ce document utile. Au revoir!


  • x
  • Standard:

Commentaire

Connectez-vous pour répondre. Se connecter | Enregistrer
envoyer

Remarque : Afin de protéger vos droits et intérêts légitimes, ceux de la communauté et des tiers, ne divulguez aucun contenu qui pourrait présenter des risques juridiques pour toutes les parties. Le contenu interdit comprend, sans toutefois s'y limiter, le contenu politiquement sensible, le contenu lié à la pornographie, aux jeux d'argent, à l'abus et au trafic de drogues, le contenu qui peut divulguer ou enfreindre la propriété intellectuelle d'autrui, y compris les secrets professionnels, les marques commerciales, les droits d'auteur et les brevets, ainsi que la vie privée personnelle. Ne partagez pas votre nom d'utilisateur ou votre mot de passe avec d'autres personnes. Toutes les opérations effectuées à partir de votre compte seront considérées comme vos propres actions, et toutes les conséquences en découlant vous seront imputées. Pour plus de détails, voir « Politique de confidentialité ».

My Followers

Connectez-vous pour participer à la communication et au partage

S'identifier

Bloquer
Êtes-vous sûr de bloquer cet utilisateur?
Les utilisateurs de votre liste noire ne peuvent ni commenter votre publication,ni vous mentionner, ni vous envoyer de messages privés.
Rappel
Veuillez lier votre numéro de téléphone pour obtenir un bonus d'invitation.