Работа с базами данных PostgreSQL
В этом разделе описана основная информация про работу с внешней базой данных PostgreSQL.
Для работы с внешней базой данных PostgreSQL необходимо выполнить следующие шаги:
-
Создать секрет, содержащий пароль для подключения к базе данных.
CREATE OBJECT postgresql_datasource_user_password (TYPE SECRET) WITH (value = "<password>"); -
Создать внешний источник данных, описывающий определённую базу данных в составе кластера PostgreSQL. При чтении по умолчанию используется пространство имен
public, но это значение можно изменить с помощью опционального параметраSCHEMA. Сетевое подключение выполняется по стандартному (Frontend/Backend Protocol) по транспорту TCP (PROTOCOL="NATIVE"). Включить шифрование соединений к внешней базе данных можно с помощью параметраUSE_TLS="TRUE".CREATE EXTERNAL DATA SOURCE postgresql_datasource WITH ( SOURCE_TYPE="PostgreSQL", LOCATION="<host>:<port>", DATABASE_NAME="<database>", AUTH_METHOD="BASIC", LOGIN="user", PASSWORD_SECRET_NAME="postgresql_datasource_user_password", PROTOCOL="NATIVE", USE_TLS="TRUE", SCHEMA="<schema>" ); -
Развернуть коннектор и настроить динамические узлы YDB на взаимодействие с ним. Также необходимо обеспечить сетевой доступ с динамических узлов YDB к внешнему источнику данных (по адресу, указанному в параметре
LOCATIONзапросаCREATE EXTERNAL DATA SOURCE). В случае, если на предыдущем шаге было включено шифрование сетевых соединений к внешнему источнику, коннектор будет использовать системные корневые сертификаты (более подробно о настройке TLS можно узнать в инструкции по разворачиванию коннектора). -
Выполнить запрос к базе данных.
Синтаксис запросов
Для работы с PostgreSQL используется следующая форма SQL-запроса:
SELECT * FROM postgresql_datasource.<table_name>
где:
postgresql_datasource- идентификатор внешнего источника данных;<table_name>- имя таблицы внутри внешнего источника данных.
Ограничения
При работе с кластерами PostgreSQL существует ряд ограничений:
-
Внешние источники доступны только для чтения данных через запросы
SELECT. Запросы, модифицирующие таблицы во внешних источниках, движком обработки федеративных запросов в настоящее время не поддерживаются. -
Если значение даты, хранящейся во внешнем источнике данных, находится вне допустимого для YDB диапазона (все используемые даты должны быть позднее 1970-01-01, но ранее 2105-12-31), в YDB такое значение будет преобразовано в
NULL. -
Система обработки федеративных запросов YDB умеет передавать исполнение некоторых частей запроса системе, выступающей в качестве источника данных. Фрагменты запроса передаются сквозь YDB непосредственно во внешнюю систему и обрабатываются внутри неё. С помощью этой оптимизации, которая носит название «пушдауна предикатов» (predicate pushdown), удаётся значительно снизить объём данных, передаваемых от источника к движку обработки федеративных запросов. Благодаря этому снижается нагрузка на сеть и экономятся вычислительные ресурсы YDB.
Частный случай пушдауна предикатов, при котором выполняется передача фильтрующих выражений, указанных после ключевого слова
WHERE, называется «пушдауном фильтров» (filter pushdown). Пушдаун фильтров возможен при использовании:Описание Пример Фильтров вида IS NULL/IS NOT NULLWHERE column1 IS NULLилиWHERE column1 IS NOT NULLЛогических условий OR,NOT,AND.WHERE column IS NULL OR column2 is NOT NULL.Условий сравнения =,<>,<,<=,>,>=c другими колонками или константами.WHERE column3 > column4 OR column5 <= 10.Поддерживаемые типы данных для пушдауна фильтров:
Тип данных YDB BoolInt8Int16Int32Int64FloatDouble
Поддерживаемые типы данных
В базе данных PostgreSQL признак опциональности значений колонки (разрешено или запрещено колонке содержать значения NULL) не является частью системы типов данных. Ограничение (constraint) NOT NULL для каждой колонки реализуется в виде атрибута attnotnull в системном каталоге pg_attribute, то есть на уровне метаданных таблицы. Следовательно, все базовые типы PostgreSQL по умолчанию могут содержать значения NULL, и в системе типов YDB они должны отображаться в опциональные типы.
Ниже приведена таблица соответствия типов PostgreSQL и YDB. Все остальные типы данных, за исключением перечисленных, не поддерживаются.
| Тип данных PostgreSQL | Тип данных YDB | Примечания |
|---|---|---|
boolean |
Optional<Bool> |
|
smallint |
Optional<Int16> |
|
int2 |
Optional<Int16> |
|
integer |
Optional<Int32> |
|
int |
Optional<Int32> |
|
int4 |
Optional<Int32> |
|
serial |
Optional<Int32> |
|
serial4 |
Optional<Int32> |
|
bigint |
Optional<Int64> |
|
int8 |
Optional<Int64> |
|
bigserial |
Optional<Int64> |
|
serial8 |
Optional<Int64> |
|
real |
Optional<Float> |
|
float4 |
Optional<Float> |
|
double precision |
Optional<Double> |
|
float8 |
Optional<Double> |
|
date |
Optional<Date> |
Допустимый диапазон дат с 1970-01-01 и до 2105-12-31. При выходе значения за границы диапазона возвращается NULL. |
timestamp |
Optional<Timestamp> |
Допустимый диапазон времени с 1970-01-01 00:00:00 и до 2105-12-31 23:59:59. При выходе значения за границы диапазона возвращается значение NULL. |
bytea |
Optional<String> |
|
character |
Optional<Utf8> |
Правила сортировки по умолчанию, строка дополняется пробелами до требуемой длины. |
character varying |
Optional<Utf8> |
Правила сортировки по умолчанию. |
text |
Optional<Utf8> |
Правила сортировки по умолчанию. |
json |
Optional<Json> |