Безопасные рестарт и выключение узлов

Остановка/рестарт процесса ydb на узле

Чтобы убедиться, что процесс можно остановить, надо выполнить следующие шаги.

  1. Перейти в узел по ssh.

  2. Выполнить команду

    kikimr cms request restart host {node_id} --user {user} --duration 60 --dry --reason 'some-reason'
    

    При разрешение выведет ALLOW.

  3. Остановить процесс

    sudo service kikimr stop
    
  4. Если потребуется, запустить процесс

     sudo service kikimr start
    

Замена оборудования

Перед заменой нужно убедиться, что процесс ydb можно остановить.
При длительном отсутствии стоит перед этим перевезти все VDisk'и с данного узла и дождаться окончания репликации.
После окончания репликации узел можно безопасно выключать.

Чтобы отключение динамического узла не оказало влияние на обработку запросов, необходимо перед отключением выполнить мягкий перенос (drain) таблеток с этого узла.

Стоит перейти на страницу Hive web-viewer.
После нажатия на кнопку "View Nodes" отобразится список всех узлов.

Перед отключением узла, сначала требуется отключить перевоз таблеток через кнопку Active, после чего нажать Drain и дождаться увоза всех таблеток.