Прямой маршрут EVN arp CloudEngine 12800

140 0 6 0

Описание проблемы

У клиента есть два DC:    "домашний DC" — DC SPB  и "гостевой DC" — MSK DC.

В ядре каждого DC имеется CSS из двух CE12808

Между DC — магистральная сеть и настроенный DCI с использованием EVN в режиме All-activeGateway.

Между двумя DC настроена фильтрация MAC VRRP.

Шлюз для внутренних подсетей - VRRP Virtual-IP на CE12808.

На DC SPB (домашние) устройства объявляют магистральную подсеть 10.245.8.128/25

На DC MSK (гостевые) устройства, объявляющие о создании магистрали только host-route / 32 с помощью ARP-записей (включение прямого маршрута arp обнаруживается virtual-ip).  Вся подсеть /25 этого DC не объявляется магистральной сети.

Клиент перемещает несколько виртуальных машин из DC SPB (домашний) в DC MSK (гостевой), при этом все маршруты автоматически переключаются, никаких проблем не возникает.

Но через некоторое время работающий заказчик обнаружил проблему:   Таблица ARP на устройствах в DC MSK (гостевая) обновляется некорректноЭто вызывает недоступность серверов.   Подробности описаны ниже.

Основной вопрос в том, как защитить сеть от такого поведения и разрешить устройствам автоматически восстанавливать доступ к перенесенным виртуальным машинам без длительного прерывания обслуживания.

 

Анализ

Давайте проясним процесс.

  1. Server1 мигрирует на Server2 и работает нормально.

  2. Сбросьте ARP на устройстве CE6800-2, после чего пользователи не смогут установить telnet-соединение с сервером Server2, поскольку в CE6800-2 нет ARP, который необходим для создания маршрута узла в NE.

  3. Таким образом, после завершения операции запуска обучения ARP на устройстве CE6800-2 все работает нормально.

Основной вопрос  как защитить сеть от такого поведения и разрешить устройствам автоматически восстанавливать доступ к перенесенным виртуальным машинам без длительного прерывания обслуживания.

  1. В нормальном состоянии, если между CE6800-2 и Server2 в течение долгого времени нет обмена данными, у ARP есть время старения ARP (20 минут), коммутатор вызовет обнаружение старения ARP до наступления времени старения, если нет обмена данными, поэтому ARP будет сохранен.

  2. В нормальном состоянии при сбросе ARP на устройстве CE6800-2 Server2 не опознает удаление ARP в коммутаторе, однако Server2 имеет время старения ARP, оно запустит обнаружение времени старения ARP, и если имеется какой-либо обмен данными (например, переброс информации или другой повод для обмена данными), также запустится обучение ARP. Но если в этот раз не будет обмена данными во время работы сервера или коммутатора, серверу может потребоваться длительное время (время старения) для запуска обучения ARP.

  3. Для версии V2R3 есть команда arp smart-discover enable и настроенное в представление vlanif, оно используется для активного обнаружения ARP виртуальной машиной или сервером, когда отсутствует ARP. Однако использовать это в нормальном состоянии не рекомендуется, если сеть очень большая, потому что пакеты ARP используют производительность ЦП для их обработки.

  4. Мы считаем, что виртуальная машина или сервер должны отправлять пакеты в нормальном состоянии, например, GARP.

  5. Если мы хотим уменьшить длительное прерывание обслуживания в этой ситуации, операция ping также является хорошим способом уменьшить время прерывания обслуживания во время миграции. Но после этого должен быть шаг (а).

 

Причины

В нормальном состоянии сбросьте ARP на устройстве CE6800-2, Server2 не опознает удаление ARP в коммутаторе, однако Server2 имеет время старения ARP, оно запустит обнаружение времени старения ARP, и если имеется какой-либо обмен данными (например, переброс информации или другой повод для обмена данными), также запустится обучение ARP. Но если в этот раз не будет обмена данными во время работы сервера или коммутатора, серверу может потребоваться длительное время (время старения) для запуска обучения ARP.

 

Решение

Виртуальная машина должна отправлять пакеты (например, GARP) для запуска обучения ARP,
но в настоящее время сервер запускает обучение ARP, что соответствует определению старения ARP, поэтому для запуска обучения ARP на сервере потребуется много времени
так что сервер уменьшит таймер GARP, что поможет обучению ARP при миграции виртуальной машины.

Операция ping также является хорошим способом уменьшить длительное прерывание обслуживания.

  • x

Комментарий

Отправить
Выполните вход в систему, чтобы ответить на пост. Вход | Регистрация

Внимание Внимание! В целях защиты правовых интересов Вас, сообщества и третьих лиц, не публикуйте любой материал, содержащий политические высказывания, порнографию, упоминание азартных игр, употребление наркотиков, а также материал, нарушающий коммерческую тайну или содержащий персональные данные пользователей. Также не предоставляйте данные от вашей учетной записи. Вы будете нести ответственность за все действия, выполняемые под вашим аккаунтом. Подробная информация: “Политика конфиденциальности..”
Если кнопка вложения недоступна, обновите Adobe Flash Player до последней версии.
Авторизуйтесь и пользуйтесь всеми преимуществами участника!

Авторизуйтесь и пользуйтесь всеми преимуществами участника!

Вход