6.5.4 Отказоустойчивый кластер (управления)

Кластер – группа серверов, спроектированная в соответствии с методиками обеспечения высокой доступности и гарантирующая минимальное время простоя за счёт конфигурации, содержащей аппаратную избыточность [1].

Pacemaker – менеджер ресурсов кластера [2], который позволяет использовать службы и объекты в рамках одного кластера, состоящего из двух или более кластерных нод [3]. Далее такой кластер будет подразумеваться под термином – PCS.

В «классической» архитектуре облачной платформы для управления отказоустойчивым кластером, состоящим из нескольких управляющих узлов (контроллеров OpenStack), используется PCS. Данное решение заложено в автоматизированный сценарий развертывания ОП TIONIX версии 3.0 (и выше).

Ниже перечислены функциональные возможности Pacemaker:

  • позволяет находить и устранять сбои на уровне узлов и служб;
  • не зависит от подсистемы хранения (общий накопитель данных не обязателен);
  • не зависит от типов ресурсов;
  • поддерживает STONITH (Shoot-The-Other-Node-In-The-Head);
  • поддерживает кворумные и ресурсозависимые кластеры любого размера;
  • поддерживает практически любую избыточную конфигурацию;
  • может автоматически реплицировать конфигурационный файл на все узлы кластера (не надо править все вручную);
  • можно задать порядок запуска ресурсов, а также их совместимость на одном узле;
  • поддерживает расширенные типы ресурсов;
  • имеет единую кластерную оболочку CRM с поддержкой скриптов.

Основное назначение PCS, применяемого в ОП TIONIX:

  • управление системными службами (сервисами);
  • мониторинг состояния служб OpenStack/TIONIX и их перезапуск (в случае отказа).

Примечание.

Суть технологии STONITH: вышедший из строя узел изолируется и запросы к нему не поступают до тех пор, пока узел не отправит сообщение о том, что он снова находится в рабочем состоянии.

Поддержка расширенных типов ресурсов заключается в следующем: клоны, ресурс которых запущен на множестве узлов, и дополнительные состояния (master/slave и подобное) актуальны для СУБД (MySQL, MariaDB и др.).

Примечание.

Сервисы cinder-volume и nova-conductor запускаются в единственном экземпляре, в силу особенностей их работы. Они привязаны только к мастеру Pacemaker.

Сноски

[1]https://www.golinuxcloud.com/configure-openstack-high-availability-pacemaker/
[2]https://wiki.clusterlabs.org/wiki/Pacemaker
[3]https://interface31.ru/tech_it/2014/06/otkazoustoychivaya-klasterizaciya-obschie-svedeniya.html