Дашборды Grafana для YDB

На этой странице представлено описание дашбордов Grafana для YDB. Как установить дашборды читайте в разделе Настройка мониторинга с помощью Prometheus и Grafana.

DB status

Общий дашборд базы данных.

Скачать шаблон дашборда DB status: dbstatus.json.

DB overview

Общий дашборд базы данных по категориям:

  • Health
  • API
  • API details
  • CPU
  • CPU pools
  • Memory
  • Storage
  • DataShard
  • DataShard details
  • Latency

Скачать шаблон дашборда DB overview: dboverview.json.

Actors

Потребление CPU в актор-системе.

Имя Описание
CPU by execution pool (us) Потребление CPU в различных пулах исполнения на всех нодах, микросекунды в секунду (один миллион соответствует потреблению одного ядра)
Actor count Количество акторов (по типу актора)
CPU Потребление CPU в различных пулах исполнения (по типу актора)
Events Метрики обработки событий в актор-системе

Скачать шаблон дашборда Actors: actors.json.

CPU

Потребление CPU в пулах исполнения.

Name Description
CPU by execution pool Потребление CPU в различных пулах исполнения на всех нодах, микросекунды в секунду (один миллион соответствует потреблению одного ядра)
Actor count Количество акторов (по типу актора)
CPU Потребление CPU в различных пулах исполнения
Events Метрики обработки событий в различных пулах исполнения

Скачать шаблон дашборда CPU: cpu.json.

gRPC

Метрики слоя gRPC.

Имя Описание
Requests Количество запросов, получаемых базой данных в секунду (по типу метода gRPC)
Request bytes Размер запросов, получаемых базой данных, байты в секунду (по типу метода gRPC)
Response bytes Размер ответов, отправляемых базой данных, байты в секунду (по типу метода gRPC)
Dropped requests Количество запросов в секунду, обработка которых была прекращена на транспортном уровне из-за ошибки (по типу метода gRPC)
Dropped responses Количество ответов в секунду, отправка которых была прекращена на транспортном уровне из-за ошибки (по типу метода gRPC)
Requests in flight Количество запросов, которые одновременно обрабатываются базой данных (по типу метода gRPC)
Request bytes in flight Размер запросов, которые одновременно обрабатываются базой данных (по типу метода gRPC)

Скачать шаблон дашборда gRPC: grpc.json.

Query engine

Сведения о движке исполнения запросов.

Имя Описание
Requests Количество входящих запросов в секунду (по типу запроса)
Request bytes Размер входящих запросов, байты в секунду (query, parameters, total)
Responses Количество ответов в секунду (по типу ответа)
Response bytes Размеры ответов, байты в секунду (total, query result)
Sessions Сведения об установленных сессиях
Latencies Гистограммы времен исполнения запросов для различных типов запросов

Скачать шаблон дашборда Query engine: queryengine.json.

TxProxy

Информация от транзакциях с уровня DataShard transaction proxy.

Имя Описание
Transactions Метрики транзакций даташардов
Latencies Гистограммы времен исполнения различных этапов транзакций даташардов

Скачать шаблон дашборда TxProxy: txproxy.json.

DataShard

Метрики таблетки DataShard.

Имя Описание
Operations Статистика операций с даташардом для разных типов операций
Transactions Информация о транзакциях таблетки даташарда (по типам транзакций)
Latencies Гистограммы времен выполнения различных этапов пользовательских транзакций
Tablet latencies Гистограммы времен выполнения транзакций таблетки
Compactions Сведения о производимых операциях LSM compaction
ReadSets Сведения о пересылаемых ReadSets при исполнении пользовательской транзакции
Other Прочие метрики

Скачать шаблон дашборда DataShard: datashard.json.

Database Hive

Метрики таблетки Hive выбранной базы данных.

На дашборде размещены следующие фильтры:

  • database — используется для выбора базы данных, метрики которой необходимо отобразить;
  • ds — используется для выбора Prometheus-источника, данные из которого необходимо отобразить на дашборде;
  • Tx type — определяет тип транзакции, для которого будут выведены графики на панели "{Tx type} average time".
Имя Описание
CPU usage by HIVE_ACTOR, HIVE_BALANCER_ACTOR Процессорное время, потребляемое HIVE_ACTOR и HIVE_BALANCER_ACTOR — двумя самыми важными акторами Hive.
Self-ping time Время ответа таблеткой Hive на собственные запросы. Высокие значения указывают на сильную загрузку (и медленную отзывчивость) Hive.
Local transaction times Время работы CPU, потребляемое для выполнения различных типов локальных транзакций в Hive. Отображает структуру нагрузки на Hive.
Tablet count Общее число таблеток в базе данных.
Event queue size Размер очереди входящих событий. Постоянно высокие значения указывают на то, что Hive не успевает обрабатывать события с требуемой скоростью.
{Tx type} average time Среднее время выполнения одной локальной транзакции типа, выбранного в фильтре Tx type.
Versions Версии YDB, запущенные на узлах кластера.
Hive node Узел, на котором запущен Hive.

Скачать шаблон дашборда Database Hive: database-hive-detailed.json.

Следующая