Системные представления базы данных

Вы можете отправлять запросы в специальные служебные представления (system views), чтобы следить за состоянием базы данных. Эти представления доступны из корня дерева базы данных и используют системный префикс пути .sys.

Индекс поля первичного ключа соответствующего представления содержится в описаниях доступных полей далее по тексту.

Системные представления содержат:

Примечание

Обращение к системным представлениям имеет скорее аналитический характер нагрузки. Частое обращение к ним в больших базах будет существенно расходовать системные ресурсы. Рекомендуемая нагрузка не более 1-2 RPS.

Партиции

Следующее системное представление хранит детализированную информацию об отдельных партициях всех таблиц базы данных:

  • partition_stats — cодержит информацию о моментальных метриках и кумулятивные счетчики операций. К первым относятся, например, данные о нагрузке на CPU или количестве выполняемых транзакций. Ко вторым — общее количество прочитанных строк.

Предназначена для выявления различных неравномерностей в нагрузке на партицию или отображения размера данных в ней.

Кумулятивные поля (RowReads, RowUpdates и т.д.) хранят накопленные значения с момента последнего старта таблетки, обслуживающей партицию.

Структура представления:

Поле Описание
OwnerId Идентификатор SchemeShard, обслуживающего таблицу.
Тип: Uint64.
Ключ: 0.
PathId Идентификатор пути в SchemeShard.
Тип: Uint64.
Ключ: 1.
PartIdx Порядковый номер партиции.
Тип: Uint64.
Ключ: 2.
DataSize Приблизительный размер партиции в байтах.
Тип: Uint64.
RowCount Приблизительное количество строк.
Тип: Uint64.
IndexSize Размер индекса партиции в таблетке.
Тип: Uint64.
CPUCores Double Моментальное значение нагрузки на партицию (доля ядра)
TabletId Идентификатор таблетки, обслуживающей партицию.
Тип: Uint64.
Path Полный путь к таблице.
Тип: Utf8.
NodeId Идентификатор ноды, на которой в данный момент обслуживается партиция.
Тип: Uint32.
StartTime Последний момент запуска таблетки, обслуживающей партицию.
Тип: Timestamp.
AccessTime Последний момент чтения из партиции.
Тип: Timestamp.
UpdateTime Последний момент записи в партицию.
Тип: Timestamp.
RowReads Количество точечных чтений с момента старта таблетки партиции.
Тип: Uint64.
RowUpdates Количество записанных строк с момента старта.
Тип: Uint64.
RowDeletes Количество удалённых строк с момента старта.
Тип: Uint64.
RangeReads Количество чтений диапазонов строк с момента старта.
Тип: Uint64.
RangeReadRows Количество строк, прочитанных в диапазонах с момента старта.
Тип: Uint64.
InFlightTxCount Количество транзакций, находящихся в процессе исполнения.
Тип: Uint64.
ImmediateTxCompleted Количество завершившихся одношардовых транзакций с момента старта.
Тип: Uint64.
CoordinatedTxCompleted Количество завершившихся координируемых транзакций с момента старта.
Тип: Uint64.
TxRejectedByOverload Количество транзакций, отменённых по причине слишком высокой нагрузки (с момента старта).
Тип: Uint64.
TxRejectedByOutOfStorage Количество транзакций, отменённых из-за нехватки места (с момента старта).
Тип: Uint64.

Примеры запросов

Топ-5 самых загруженных партиций среди всех таблиц базы данных:

SELECT
    Path,
    PartIdx,
    CPUCores
FROM `.sys/partition_stats`
ORDER BY CPUCores DESC
LIMIT 5

Список таблиц базы с размерами и нагрузкой в моменте:

SELECT
    Path,
    COUNT(*) as Partitions,
    SUM(RowCount) as Rows,
    SUM(DataSize) as Size,
    SUM(CPUCores) as CPU
FROM `.sys/partition_stats`
GROUP BY Path

Топы запросов

Следующие системные представления хранят данные для анализа потока пользовательских запросов:

  • top_queries_by_duration_one_minute — данные разбиты на минутные интервалы, содержит топ-5 запросов с наибольшим полным временем исполнения за последние 6 часов;
  • top_queries_by_duration_one_hour — данные разбиты на часовые интервалы, содержит топ-5 запросов с наибольшим полным временем исполнения за последние 2 недели;
  • top_queries_by_read_bytes_one_minute — данные разбиты на минутные интервалы, содержит топ-5 запросов с наибольшим количеством прочитанных из таблицы байт за последние 6 часов;
  • top_queries_by_read_bytes_one_hour — данные разбиты на часовые интервалы, содержит топ-5 запросов с наибольшим количеством прочитанных из таблицы байт за последние 2 недели;
  • top_queries_by_cpu_time_one_minute — данные разбиты на минутные интервалы, содержит топ-5 запросов с наибольшим затраченным процессорным временем за последние 6 часов;
  • top_queries_by_cpu_time_one_hour — данные разбиты на часовые интервалы, содержит топ-5 запросов с наибольшим затраченным процессорным временем за последние 2 недели.

Различные запуски запроса с одним и тем же текстом дедуплицируются. Топ содержит информацию о конкретном запуске с максимальным значением соответствующей характеристики запроса в пределах одного временного интервала.

Поля, предоставляющие информацию о затраченном процессорном времени (...CPUTime), выражены в микросекундах.

Текст запроса ограничен 4 килобайтами.

Все представления содержат одинаковый набор полей:

Поле Описание
IntervalEnd Момент закрытия минутного или часового интервала.
Тип: Timestamp.
Ключ: 0.
Rank Ранг запроса в топе.
Тип: Uint32.
Ключ: 1.
QueryText Текст запроса.
Тип: Utf8.
Duration Полное время исполнения запроса.
Тип: Interval.
EndTime Момент окончания исполнения запроса.
Тип: Timestamp.
Type Тип запроса ("data", "scan", "script").
Тип: String.
ReadRows Количество прочитанных строк.
Тип: Uint64.
ReadBytes Количество прочитанных байт.
Тип: Uint64.
UpdateRows Количество записанных строк.
Тип: Uint64.
UpdateBytes Количество записанных байт.
Тип: Uint64.
DeleteRows Количество удалённых строк.
Тип: Uint64.
DeleteBytes Количество удалённых байт.
Тип: Uint64.
Partitions Количество партиций таблиц, участвовавших в исполнении запроса.
Тип: Uint64.
UserSID Security ID пользователя.
Тип: String.
ParametersSize Размер параметров запроса в байтах.
Тип: Uint64.
CompileDuration Длительность компиляции запроса.
Тип: Interval.
FromQueryCache Использовался ли кэш подготовленных запросов.
Тип: Bool.
CPUTime Общее процессорное время, использованное для исполнения запроса (микросекунды).
Тип: Uint64.
ShardCount Количество шардов, участвующих в исполнении запроса.
Тип: Uint64.
SumShardCPUTime Общее процессорное время, затраченное в шардах.
Тип: Uint64.
MinShardCPUTime Минимальное процесорное время, затраченное в шардах.
Тип: Uint64.
MaxShardCPUTime Максимальное процессорное время, затраченное в шардах.
Тип: Uint64.
ComputeNodesCount Количество вычислительных нод, задействованных в исполнении запроса.
Тип: Uint64.
SumComputeCPUTime Общее процессорное время, затраченное в вычислительных нодах.
Тип: Uint64.
MinComputeCPUTime Минимальное процессорное время, затраченное в вычислительных нодах.
Тип: Uint64.
MaxComputeCPUTime Максимальное процессорное время, затраченное в вычислительных нодах.
Тип: Uint64.
CompileCPUTime Процессорное время, затраченное на компиляцию запроса.
Тип: Uint64.
ProcessCPUTime Процессорное время, затраченное на общую обработку запроса.
Тип: Uint64.

Примеры запросов

Топ запросов по времени выполнения за последнюю минуту их отправки:

PRAGMA AnsiInForEmptyOrNullableItemsCollections;
$last = (
    SELECT
        MAX(IntervalEnd)
    FROM `.sys/top_queries_by_duration_one_minute`
);
SELECT
    IntervalEnd,
    Rank,
    QueryText,
    Duration
FROM `.sys/top_queries_by_duration_one_minute`
WHERE IntervalEnd IN $last

Запросы, прочитавшие больше всего байт, в разбивке по минутам:

SELECT
    IntervalEnd,
    QueryText,
    ReadBytes,
    ReadRows,
    Partitions
FROM `.sys/top_queries_by_read_bytes_one_minute`
WHERE Rank = 1

Подробная информация о запросах

Следующее системное представление содержит подробную информацию о запросах:

  • query_metrics_one_minute — данные разбиты по минутным интервалам, содержит до 256 запросов за последние 6 часов.

Каждая строка представления содержит информацию о множестве случившихся за интервал запросов с одинаковым текстом. Поля представления предоставляют минимальное, максимальное и суммарное значение по каждой отслеживаемой характеристике запроса. В пределах интервала запросы отсортированы по убыванию суммарного потраченного процессорного времени.

Ограничения:

  • текст запроса ограничен 4 килобайтами;
  • статистика может быть неполной, если база испытывает сильную нагрузку.

Структура представления:

Поле Описание
IntervalEnd Момент закрытия минутного интервала.
Тип: Timestamp.
Ключ: 0.
Rank Ранг запроса в пределах интервала (по полю SumCPUTime).
Тип: Uint32.
Ключ: 1.
QueryText Текст запроса.
Тип: Utf8.
Count Количество запусков запроса.
Тип: Uint64.
SumDuration Общая длительность запросов.
Тип: Interval.
Count Количество запусков запроса.
Тип: Uint64.
SumDuration Общая длительность запросов.
Тип: Interval.
MinDuration Минимальная длительность запроса.
Тип: Interval.
MaxDuration Максимальная длительность запроса.
Тип: Interval.
SumCPUTime Общее затраченное процессорное время.
Тип: Uint64.
MinCPUTime Минимальное затраченное процессорное время.
Тип: Uint64.
MaxCPUTime Максимальное затраченное процессорное время.
Тип: Uint64.
SumReadRows Общее количество прочитанных строк.
Тип: Uint64.
MinReadRows Минимальное количество прочитанных строк.
Тип: Uint64.
MaxReadRows Максимальное количество прочитанных строк.
Тип: Uint64.
SumReadBytes Общее количество прочитанных байт.
Тип: Uint64.
MinReadBytes Минимальное количество прочитанных байт.
Тип: Uint64.
MaxReadBytes Максимальное количество прочитанных байт.
Тип: Uint64.
SumUpdateRows Общее количество записанных строк.
Тип: Uint64.
MinUpdateRows Минимальное количество записанных строк.
Тип: Uint64.
MaxUpdateRows Максимальное количество записанных строк.
Тип: Uint64.
SumUpdateBytes Общее количество записанных байт.
Тип: Uint64.
MinUpdateBytes Минимальное количество записанных байт.
Тип: Uint64.
MaxUpdateBytes Максимальное количество записанных байт.
Тип: Uint64.
SumDeleteRows Общее количество удалённых строк.
Тип: Uint64.
MinDeleteRows Минимальное количество удалённых строк.
Тип: Uint64.
MaxDeleteRows Максимальное количество удалённых строк.
Тип: Uint64.

Примеры запросов

Топ-10 запросов за последние 6 часов по общему количеству записанных строк в минутном интервале:

SELECT
    SumUpdateRows,
    Count,
    QueryText,
    IntervalEnd
FROM `.sys/query_metrics_one_minute`
ORDER BY SumUpdateRows DESC LIMIT 10

Недавние запросы, прочитавшие больше всего байт за минуту:

SELECT
    IntervalEnd,
    SumReadBytes,
    MinReadBytes,
    SumReadBytes / Count as AvgReadBytes,
    MaxReadBytes,
    QueryText
FROM `.sys/query_metrics_one_minute`
WHERE SumReadBytes > 0
ORDER BY IntervalEnd DESC, SumReadBytes DESC
LIMIT 100

История перегруженных партиций

Следующие системные представления содержат историю моментов высокой нагрузки на отдельные партиции таблиц БД:

  • top_partitions_one_minute — данные разбиты на минутные интервалы, содержит историю за последние 6 часов;
  • top_partitions_one_hour — данные разбиты на часовые интервалы, содержит историю за последние 2 недели.

В представления попадают партиции с пиковой нагрузкой более 70 % (CPUCores > 0,7). В пределах одного интервала партиции ранжированы по пиковому значению нагрузки.

Оба представления содержат одинаковый набор полей:

Поле Описание
IntervalEnd Момент закрытия минутного или часового интервала.
Тип: Timestamp.
Ключ: 0.
Rank Ранг партиции в пределах интервала (по CPUCores).
Тип: Uint32.
Ключ: 1.
TabletId Идентификатор таблетки, обслуживающей партицию.
Тип: Uint64.
Path Полный путь к таблице.
Тип: Utf8.
PeakTime Момент пикового значения в пределах интервала.
Тип: Timestamp.
CPUCores Пиковое значение нагрузки на партицию (доля ядра).
Тип: Double.
NodeId Идентификатор ноды, на которой находилась партиция в момент пика.
Тип: Uint32.
DataSize Приблизительный размер партиции в байтах в момент пика.
Тип: Uint64.
RowCount Приблизительное количество строк в момент пика.
Тип: Uint64.
IndexSize Размер индекса партиции в таблетке в момент пика.
Тип: Uint64.
InFlightTxCount Количество транзакций, находящихся в процессе исполнения в момент пика.
Тип: Uint32.

Примеры запросов

Следующий запрос выводит партиции с потреблением CPU более 70% в указанном интервале времени, с идентификаторами таблеток и их размерами на момент превышения. Запрос выполняется к представлению .sys/top_partitions_one_minute, которое содержит данные за последние 6 часов с разбиением по часовым интервалам:

SELECT
    IntervalEnd,
    CPUCores,
    Path,
    TabletId,
    DataSize
FROM `.sys/top_partitions_one_minute`
WHERE CPUCores > 0.7
AND IntervalEnd BETWEEN Timestamp("YYYY-MM-DDThh:mm:ss.uuuuuuZ") AND Timestamp("YYYY-MM-DDThh:mm:ss.uuuuuuZ")
ORDER BY IntervalEnd desc, CPUCores desc
  • "YYYY-MM-DDTHH:MM:SS.UUUUUUZ" — время в зоне UTC 0 (YYYY — год, MM — месяц, DD — число, hh — часы, mm — минуты, ss — секунды, uuuuuu — микросекунды). Например, "2023-01-26T13:00:00.000000Z".

Следующий запрос выводит партиции с потреблением CPU более 90% в указанном интервале времени, с идентификаторами таблеток и их размерами на момент превышения. Запрос выполняется к представлению .sys/top_partitions_one_hour, которое содержит данные за последние 2 недели с разбиением по минутным интервалам:

SELECT
    IntervalEnd,
    CPUCores,
    Path,
    TabletId,
    DataSize
FROM `.sys/top_partitions_one_hour`
WHERE CPUCores > 0.9
AND IntervalEnd BETWEEN Timestamp("YYYY-MM-DDThh:mm:ss.uuuuuuZ") AND Timestamp("YYYY-MM-DDThh:mm:ss.uuuuuuZ")
ORDER BY IntervalEnd desc, CPUCores desc
  • "YYYY-MM-DDTHH:MM:SS.UUUUUUZ" — время в зоне UTC 0 (YYYY — год, MM — месяц, DD — число, hh — часы, mm — минуты, ss — секунды, uuuuuu — микросекунды). Например, "2023-01-26T13:00:00.000000Z".
Предыдущая
Следующая