F.25. intagg — агрегатор и перечислитель целых чисел#
F.25. intagg — агрегатор и перечислитель целых чисел #
Модуль intagg
предоставляет агрегатор целых чисел и перечислитель. intagg
теперь устарел, поскольку существуют встроенные функции, которые предоставляют набор возможностей, превосходящий его. Однако модуль все еще предоставляется в качестве оболочки совместимости для встроенных функций.
F.25.1. Функции #
Агрегатор - это агрегатная функция
int_array_aggregate(integer)
которая создает целочисленный массив
содержащий ровно те целые числа, которые ему подаются.
Это обертка вокруг array_agg
,
которая делает то же самое для любого типа массива.
Перечислитель - это функция int_array_enum(integer[])
, которая возвращает setof integer
. Она является, по сути, обратной операцией агрегатора: заданному массиву целых чисел она расширяет его в набор строк. Это обертка вокруг функции unnest
, которая выполняет то же самое для любого типа массива.
F.25.2. Примеры использования #
Многие системы баз данных имеют понятие таблицы "многие ко многим". Такая таблица обычно располагается между двумя индексированными таблицами, например:
CREATE TABLE left_table (id INT PRIMARY KEY, ...); CREATE TABLE right_table (id INT PRIMARY KEY, ...); CREATE TABLE many_to_many(id_left INT REFERENCES left_table, id_right INT REFERENCES right_table);
Обычно он используется так:
SELECT right_table.*
FROM right_table JOIN many_to_many ON (right_table.id = many_to_many.id_right)
WHERE many_to_many.id_left = item
;
Это вернет все элементы в правой таблице для записи в левой таблице. Это очень распространенная конструкция в SQL.
Теперь эта методология может быть обременительной при очень большом количестве записей в таблице many_to_many
. Часто такое соединение приводит к сканированию индекса и выборке для каждой записи справа в таблице для конкретной записи слева. Если у вас очень динамичная система, вы мало что можете сделать. Однако, если у вас есть данные, которые довольно статичны, можно создать сводную таблицу с агрегатором.
CREATE TABLE summary AS SELECT id_left, int_array_aggregate(id_right) AS rights FROM many_to_many GROUP BY id_left;
Это создаст таблицу с одной строкой для каждого левого элемента и массивом правых элементов. Теперь это довольно бесполезно без способа использования массива; вот почему есть перечислитель массива. Вы можете сделать
SELECT id_left, int_array_enum(rights) FROM summary WHERE id_left = item
;
Вышеуказанный запрос, использующий функцию int_array_enum
, дает те же результаты, что и
SELECT id_left, id_right FROM many_to_many WHERE id_left = item
;
Разница в том, что запрос к сводной таблице должен получить
только одну строку из таблицы, тогда как прямой запрос к
many_to_many
должен выполнить индексное сканирование и извлечь строку для каждой записи.
На одной системе EXPLAIN
показал, что запрос со стоимостью 8488 был
уменьшен до стоимости 329. Исходный запрос был соединением, включающим
таблицу many_to_many
, которая была заменена на:
SELECT id_right, count(id_right) FROM
( SELECT id_left, int_array_enum(rights) AS id_right
FROM summary
JOIN (SELECT id FROM left_table
WHERE id = item
) AS lefts
ON (summary.id_left = lefts.id)
) AS list
GROUP BY id_right
ORDER BY count DESC;