7.5.3 Восстановление вычислительного узла

ВАЖНО.

Конфигурация доступа репозиториям, содержащим программные пакеты, образующие ОП TIONIX необходимой версии (релиза), должна соответствовать конфигурации, настроенной на контроллере.

Ниже изложены операции, выполняемые на исправном вычислительном узле облачной инфраструктуры, после загрузки должным образом настроенной ОС:

  1. Установите на ВУ требуемые пакеты:

    dnf install  openstack-nova-compute \
    neutron-l3-agent neutron-metadata-agent neutron-openvswitch-agent
    
  2. Разархивируйте из резервной копии, созданной ранее, директории, содержащие конфигурационные файлы (с соблюдением исходных путей).

  3. Включите требуемые сервисы:

    systemctl enable  openstack-nova-compute \
    neutron-l3-agent neutron-metadata-agent neutron-openvswitch-agent
    
  4. Перезагрузите ВУ (восстановленную ноду):

    reboot
    

Примечания.

Подробности по добавлению и настройке ВУ изложены в документе Инструкция по развертыванию ОП TIONIX.

Если по каким-либо причинам команда reboot не сработала, попробуйте сделать перезагрузку ВУ другими способами, не приводящими к потере данных, связанных с конфигурацией служб OpenStack и модулей ОП TIONIX.

Если, ввиду неисправности одной из компонент серверного устройства (сетевого адаптера и т.п.), в процессе отключения служб происходят зависания – полное отсутствие отклика – используйте интерфейс IPMI, например – ipmitool chassis power cycle [1].

Также как управляющие, вычислительные узлы могут давать сбой. Сбой в работе материнской платы серверного устройства или других аппаратных ресурсов могут вызывать такие ситуации как потеря управляемости ВУ [2]. В таком случае, все инстансы, выполняемые за счет ресурсов узла, перестанут быть доступными.

Примечание.

Если мониторинг инфраструктуры не обнаруживает сбой ВУ и не будут предприняты должные меры по восстановлению, пользователи инфраструктуры начнут обращаться за помощью в связи с потерей определенного функционала (недоступностью ВМ и т.п.).

Если ВУ дал сбой и не восстановился втечение нескольких часов (или никогда), можно выполнить перезапуск всех инстансов, которые ранее обслуживались этим узлом. Это возможно в случае, если используется общее хранилище (shared storage), смонтированное в /var/lib/nova/instances.

Внимание.

Если вычислительный узел вышел окончательно из строя и основной причиной отказа является аппаратура, то потребуется ввести в строй новое СВТ той ме серии/модели, взятое из ЗИП или закупленное в соответствии с заказной спецификацией.

Сноски

[1]https://habr.com/ru/post/98770/
[2]https://docs.openstack.org/operations-guide/ops-maintenance-compute.html