Хорошо

Не поднимается LACP между двумя стеками коммутаторов

Последний ответ май 31, 2021 23:34:38 369 1 5 0 0

Описание  задачи

Клиент обратился с проблемой – не поднимается LACP между двумя стеками коммутаторов CE6863 и свитч - модулей  CX710:

1

 

Интерфейсы на CE6863 работают в режиме 10G, а на CX710 - просплитованы (4*10G).

"На CX710 в LAG собирается только 4 порта - 40GE1/17/1:1, 40GE1/17/1:3, 40GE1/17/2:2, 40GE1/17/2:4. Остальные интерфейсы на этом блейде не собираются, на втором не собирается в LAG ни один порт.  со стороны CX710 selected было только 4 этих порта, любая другая комбинация попадала в unselected. С физикой проблем нет, патч-корды проверял, меняя местами."

Клиент преполагает, что проблема связана с использованием брейкаута между двумя стеками (даже при полностью отключенном первом CX710, порты на втором не собирались) или  софтовый баг.

//брейкаут  - имеется ввиду кабель для возможности сплитования портов:

2


Желаемый сценарий – максимально возможное количество активных интерфейсов в LAG.

 

Текущий софт клиента:

CE6863 - Version 8.191 (CE6863 V200R019C10SPC800)

CX710 - Version 8.120 (OSCA V100R005C70)

 

Анализ

 1.      Для устранения влияния возможного известного бага программного обеспечения рекоменовано установить  последние патчи для обоих типов устройств. По результату обновления проблема не была устранена.


2.      Далее мы обратили внимание на следующий вывод, на основании которого начали подозревать проблему на L1:

3


Проверка  логов показала - согласование LACP не удалось, наиболее вероятной причиной является проблема с оптическим соединением:

 Apr  1 2021 19:46:50 ХХХ_ХХХ-01 %LACP/3/OPTICAL_FIBER_MISCONNECT(l):CID=0x80480480;The member of the LACP mode Eth-Trunk interface received an abnormal LACPDU, which may be caused by optical fiber misconnection or changed packet. (TrunkName=Eth-trunk1, PortName=40GE2/17/1:2, LocalSysPri=32768, PDUSysPri=32768, LocalSysId=ххх, PDUSysId=ххх, LocalPortKey=321, PDUPortKey=321, LocalPortPri=32768, PDUPortPri=32768, LocalPortNumber=2, PDUPortNumber=1, LocalPortState=10100000, PDUPortState=10100011)

...

Apr  1 2021 19:46:50 ХХХ_ХХХ-01 %LACP/3/OPTICAL_FIBER_MISCONNECT(l):CID=0x80480480;The member of the LACP mode Eth-Trunk interface received an abnormal LACPDU, which may be caused by optical fiber misconnection or changed packet. (TrunkName=Eth-trunk1, PortName=40GE2/17/2:2, LocalSysPri=32768, PDUSysPri=32768, LocalSysId=ххх, PDUSysId=ххх, LocalPortKey=321, PDUPortKey=321, LocalPortPri=32768, PDUPortPri=32768, LocalPortNumber=6, PDUPortNumber=8, LocalPortState=10100000, PDUPortState=10100011)

 

 3.      Затем мы  провели детальную проверку оптических соединений:

Для примера  рассмотрено  одно из успешных соединений (25 GE 1/0/4 на CE и ответный 40GE 1/17/1:1 на CX710) и одно неуспешное (25 GE 2/0/3 на CE и ответный 40GE 1/17/1:4 на CX710)

 

4


Согласно диагностике, порты, к которым подключена оптика (port number и partner part number), соответствуют друг другу в случае с выбранным  успешным (selected) линком:

 

На CE switch, interface 25GE1/0/4, port number  - 12, partner port  - 11.

На CX710, interface 40GE1/17/1:1 port number  -  11, partner port - 12.

 

В то же время,  на unselected линке  (25 GE 2/0/3 на CE и ответный 40GE 1/17/1:4 на CX710) мы увидели, что port number и partner part number не совпадают:

 

На CE switch,  interface 25GE2/0/3, port number - 15, partner port number - 14.

На  CX710,  40GE1/17/1:4 port number  - 14, but the partner port number  - 11,

хотя должен быть -  15.


5

 

По результатам проверки оптических портов breakout кабеля было подтверждено: пары lc-lc были неправильно  распаяны. все пары были аккуратно переварены, после чего работа была полностью восстановлена:

6


Причина неисправности:

В breakout кабеле выявлена некорректная переварка оптических пар lc-lc

 

Решение:

Переварка LC-LC пар была последвательно скорректирована, после чего работа была полностью восстановлена.

 


Пост синхронизирован: Траблшутинг коммутаторов S-серии

  • x

mkabanov
HCIE MVE Author Опубликовано 2021-5-31 23:34:38
Т. е. прием-передачу на одном из линков перепутали? (хорошо, что откопали сравнительно быстро!)
Интересно, а "защита" от этого (определение однонаправленного подключения) - помогла-бы?
я про это:
https://support.huawei.com/enterprise/ru/doc/EDOC1000178176/654f91c/unidirectional-link-processing?utm_medium=affiliate&utm_source=tradedoubler&tduid=e2b95c8296417a43b2a1bb8a29b2bc6a&utm_content=adgoal+ES
Развернуть
  • x

Комментарий

Выполните вход в систему, чтобы ответить на пост. Вход | Регистрация
Отправить

Внимание! В целях защиты правовых интересов Вас, сообщества и третьих лиц, не публикуйте любой материал, содержащий политические высказывания, порнографию, упоминание азартных игр, употребление наркотиков, а также материал, нарушающий коммерческую тайну или содержащий персональные данные пользователей. Также не предоставляйте данные от вашей учетной записи. Вы будете нести ответственность за все действия, выполняемые под вашим аккаунтом. Подробная информация: “Пользовательское соглашение.”

My Followers

Авторизуйтесь и пользуйтесь всеми преимуществами участника!

Вход

Заблокировать
Вы уверены, что хотите заблокировать этого пользователя?
Пользователи из вашего черного списка не могут комментировать ваши посты, не могут упоминать вас, не могут отправлять личные сообщения.
Напоминание
Пожалуйста, привяжите свой мобильный номер чтобы получить бонус за приглашение.