Настройка автоматической эвакуации с использованием хранилища общей доступности

  1. Открыть файл конфигурации cloud_manager.conf и настроить параметры:

    Секция [host_tasks]:

    • allow_evacuate_host = True (параметр разрешает (либо запрещает) эвакуацию хостов, по умолчанию имеет значение True)
    • evacuation_retries = 2 (параметр определяет количество попыток эвакуации виртуальных машин с вычислительного узла, значение по умолчанию 2)

    Примечание

    Также необходимо убедиться, что в значениях параметра deny_evacuate не указаны узлы, для которых запрещена эвакуация. Для узлов, указанных в данном параметре, автоматическая эвакуация производиться не будет.

    Секция [node_tracker]:

    • enabled = True (параметр разрешает проверку статуса вычислительных узлов, по умолчанию имеет значение True)
    • max_down_hosts = 1, 2, 3... (≥ 1) ( параметр определяет максимально допустимое количество вычислительных узлов в статусе down, за исключением резервных. При превышении этого количества автоматическая эвакуация не производится ни для одного из узлов. Отрицательные числа недопустимы. По умолчанию параметр имеет значение 0, автоматическая эвакуация при этом не производится)
    • mutex = 3 (параметр определяет количество попыток определения статуса гипервизора при переходе в статус down перед запуском обработчика, по умолчанию параметр имеет значение 3)
    • loop_time = 30 (параметр определяет интервал времени между проверками статуса вычислительных узлов в секундах, по умолчанию параметр имеет значение 30)

    Секция [extra_availability_check]:

    • enabled =  True (параметр для включения или отключения дополнительной проверки доступности вычислительных узлов через хранилище, параметр по умолчанию False)
    • delay = 60 (параметр определяет задержку при повторной попытке считывания файла состояния вычислительного узла в секундах, параметр по умолчанию 60)
    • attempts = 2 (параметр определяет количество попыток считывания файла, параметр по умолчанию 2)
    • instance_rate = 100 (параметр определяет необходимый процент запущенных виртуальных машин, параметр по умолчанию 100)

    Параметр instance_rate определяет верность принятия решений об аварийном выходе из строя виртуальной машины.

    Если время записи в файл позже времени перехода статуса вычислительного узла в DOWN, то считается процент запущенных машин для ВУ.

    Если процент запущенных виртуальных машин для вычислительных узлов меньше, чем процент, указанный в конфигурационном файле, то статус DOWN считается некорректным и обрабатывается по стандартному алгоритму.

  2. Перезапустить службы модуля CloudManager, чтобы изменения в файле конфигурации вступили в силу:

    sudo i - режим суперпользователя
    systemctl restart aos-cloud-manager-*
    
  3. В Dashboard создать хранилище проверки доступности (Администратор- Инфраструктура - Хранилища проверки доступности), назначить хранилище на необходимый гипервизор:

    ../../_images/assigning_storage_to_hypervisor.png

    Назначение хранилища гипервизору

  4. Создать виртуальную машину, выбрав необходимый гипервизор, на который назначено хранилище проверки доступности.

В результате совершенных действий, при запуске автоэвакуации виртуальные машины будут эвакуированы с использованием хранилища общей доступности.