F.25. intagg — агрегатор и перечислитель целых чисел#

F.25. intagg — агрегатор и перечислитель целых чисел

F.25. intagg — агрегатор и перечислитель целых чисел #

Модуль intagg предоставляет агрегатор целых чисел и перечислитель. intagg теперь устарел, поскольку существуют встроенные функции, которые предоставляют набор возможностей, превосходящий его. Однако модуль все еще предоставляется в качестве оболочки совместимости для встроенных функций.

F.25.1. Функции #

Агрегатор - это агрегатная функция int_array_aggregate(integer) которая создает целочисленный массив содержащий ровно те целые числа, которые ему подаются. Это обертка вокруг array_agg, которая делает то же самое для любого типа массива.

Перечислитель - это функция int_array_enum(integer[]), которая возвращает setof integer. Она является, по сути, обратной операцией агрегатора: заданному массиву целых чисел она расширяет его в набор строк. Это обертка вокруг функции unnest, которая выполняет то же самое для любого типа массива.

F.25.2. Примеры использования #

Многие системы баз данных имеют понятие таблицы "многие ко многим". Такая таблица обычно располагается между двумя индексированными таблицами, например:

CREATE TABLE left_table  (id INT PRIMARY KEY, ...);
CREATE TABLE right_table (id INT PRIMARY KEY, ...);
CREATE TABLE many_to_many(id_left  INT REFERENCES left_table,
                          id_right INT REFERENCES right_table);

Обычно он используется так:

SELECT right_table.*
FROM right_table JOIN many_to_many ON (right_table.id = many_to_many.id_right)
WHERE many_to_many.id_left = item;

Это вернет все элементы в правой таблице для записи в левой таблице. Это очень распространенная конструкция в SQL.

Теперь эта методология может быть обременительной при очень большом количестве записей в таблице many_to_many. Часто такое соединение приводит к сканированию индекса и выборке для каждой записи справа в таблице для конкретной записи слева. Если у вас очень динамичная система, вы мало что можете сделать. Однако, если у вас есть данные, которые довольно статичны, можно создать сводную таблицу с агрегатором.

CREATE TABLE summary AS
  SELECT id_left, int_array_aggregate(id_right) AS rights
  FROM many_to_many
  GROUP BY id_left;

Это создаст таблицу с одной строкой для каждого левого элемента и массивом правых элементов. Теперь это довольно бесполезно без способа использования массива; вот почему есть перечислитель массива. Вы можете сделать

SELECT id_left, int_array_enum(rights) FROM summary WHERE id_left = item;

Вышеуказанный запрос, использующий функцию int_array_enum, дает те же результаты, что и

SELECT id_left, id_right FROM many_to_many WHERE id_left = item;

Разница в том, что запрос к сводной таблице должен получить только одну строку из таблицы, тогда как прямой запрос к many_to_many должен выполнить индексное сканирование и извлечь строку для каждой записи.

На одной системе EXPLAIN показал, что запрос со стоимостью 8488 был уменьшен до стоимости 329. Исходный запрос был соединением, включающим таблицу many_to_many, которая была заменена на:

SELECT id_right, count(id_right) FROM
  ( SELECT id_left, int_array_enum(rights) AS id_right
    FROM summary
    JOIN (SELECT id FROM left_table
          WHERE id = item) AS lefts
    ON (summary.id_left = lefts.id)
  ) AS list
  GROUP BY id_right
  ORDER BY count DESC;