39.3. Материализованные представления#

39.3. Материализованные представления

39.3. Материализованные представления

Материализованные представления в Tantor SE используют систему правил, как и обычные представления, но сохраняют результаты в форме таблицы. Основные отличия между:

CREATE MATERIALIZED VIEW mymatview AS SELECT * FROM mytab;

и

CREATE TABLE mymatview AS SELECT * FROM mytab;

это означает, что материализованное представление не может быть непосредственно обновлено, и что запрос, используемый для создания материализованного представления, хранится точно так же, как и запрос представления, так что для материализованного представления можно сгенерировать свежие данные с помощью:

REFRESH MATERIALIZED VIEW mymatview;

Информация о материализованном представлении в системных каталогах Tantor SE точно такая же, как и для таблицы или представления. Для парсера материализованное представление является отношением, так же как таблица или представление. Когда материализованное представление ссылается в запросе, данные возвращаются непосредственно из материализованного представления, как из таблицы; правило используется только для заполнения материализованного представления.

В то время как доступ к данным, хранящимся в материализованном представлении, часто намного быстрее, чем доступ к базовым таблицам напрямую или через представление, данные не всегда актуальны; однако иногда актуальные данные не требуются. Рассмотрим таблицу, которая записывает продажи:

CREATE TABLE invoice (
    invoice_no    integer        PRIMARY KEY,
    seller_no     integer,       -- ID of salesperson
    invoice_date  date,          -- date of sale
    invoice_amt   numeric(13,2)  -- amount of sale
);

Если люди хотят иметь возможность быстро отображать графики исторических данных о продажах, они могут захотеть суммировать и, возможно, не обращать внимания на неполные данные для текущей даты:

CREATE MATERIALIZED VIEW sales_summary AS
  SELECT
      seller_no,
      invoice_date,
      sum(invoice_amt)::numeric(13,2) as sales_amt
    FROM invoice
    WHERE invoice_date < CURRENT_DATE
    GROUP BY
      seller_no,
      invoice_date;

CREATE UNIQUE INDEX sales_summary_seller
  ON sales_summary (seller_no, invoice_date);

Этот материализованный вид может быть полезен для отображения графика на панели инструментов, созданной для продавцов. Задание может быть запланировано для обновления статистики каждую ночь с использованием следующего SQL-запроса:

REFRESH MATERIALIZED VIEW sales_summary;

Другое использование материализованного представления - обеспечение более быстрого доступа к данным, полученным из удаленной системы через внешний обертыватель данных. Приведен простой пример использования file_fdw с указанием времени выполнения, но поскольку здесь используется кеш на локальной системе, разница в производительности по сравнению с доступом к удаленной системе обычно будет больше, чем показано здесь. Обратите внимание, что мы также используем возможность создания индекса на материализованном представлении, в то время как file_fdw не поддерживает индексы; это преимущество может не применяться к другим типам доступа к внешним данным.

Настройка:

CREATE EXTENSION file_fdw;
CREATE SERVER local_file FOREIGN DATA WRAPPER file_fdw;
CREATE FOREIGN TABLE words (word text NOT NULL)
  SERVER local_file
  OPTIONS (filename '/usr/share/dict/words');
CREATE MATERIALIZED VIEW wrd AS SELECT * FROM words;
CREATE UNIQUE INDEX wrd_word ON wrd (word);
CREATE EXTENSION pg_trgm;
CREATE INDEX wrd_trgm ON wrd USING gist (word gist_trgm_ops);
VACUUM ANALYZE wrd;

Теперь давайте проверим орфографию слова. Используя file_fdw напрямую:

SELECT count(*) FROM words WHERE word = 'caterpiler';

 count
-------
     0
(1 row)

С помощью тега EXPLAIN ANALYZE мы видим:

 Aggregate  (cost=21763.99..21764.00 rows=1 width=0) (actual time=188.180..188.181 rows=1 loops=1)
   ->  Foreign Scan on words  (cost=0.00..21761.41 rows=1032 width=0) (actual time=188.177..188.177 rows=0 loops=1)
         Filter: (word = 'caterpiler'::text)
         Rows Removed by Filter: 479829
         Foreign File: /usr/share/dict/words
         Foreign File Size: 4953699
 Planning time: 0.118 ms
 Execution time: 188.273 ms

Если вместо этого используется материализованное представление, запрос выполняется намного быстрее:

 Aggregate  (cost=4.44..4.45 rows=1 width=0) (actual time=0.042..0.042 rows=1 loops=1)
   ->  Index Only Scan using wrd_word on wrd  (cost=0.42..4.44 rows=1 width=0) (actual time=0.039..0.039 rows=0 loops=1)
         Index Cond: (word = 'caterpiler'::text)
         Heap Fetches: 0
 Planning time: 0.164 ms
 Execution time: 0.117 ms

В любом случае, слово написано неправильно, поэтому давайте поищем, что мы могли бы хотеть. Снова используя file_fdw и pg_trgm:

SELECT word FROM words ORDER BY word <-> 'caterpiler' LIMIT 10;

     word
---------------
 cater
 caterpillar
 Caterpillar
 caterpillars
 caterpillar's
 Caterpillar's
 caterer
 caterer's
 caters
 catered
(10 rows)

 Limit  (cost=11583.61..11583.64 rows=10 width=32) (actual time=1431.591..1431.594 rows=10 loops=1)
   ->  Sort  (cost=11583.61..11804.76 rows=88459 width=32) (actual time=1431.589..1431.591 rows=10 loops=1)
         Sort Key: ((word <-> 'caterpiler'::text))
         Sort Method: top-N heapsort  Memory: 25kB
         ->  Foreign Scan on words  (cost=0.00..9672.05 rows=88459 width=32) (actual time=0.057..1286.455 rows=479829 loops=1)
               Foreign File: /usr/share/dict/words
               Foreign File Size: 4953699
 Planning time: 0.128 ms
 Execution time: 1431.679 ms

Использование материализованного представления:

 Limit  (cost=0.29..1.06 rows=10 width=10) (actual time=187.222..188.257 rows=10 loops=1)
   ->  Index Scan using wrd_trgm on wrd  (cost=0.29..37020.87 rows=479829 width=10) (actual time=187.219..188.252 rows=10 loops=1)
         Order By: (word <-> 'caterpiler'::text)
 Planning time: 0.196 ms
 Execution time: 198.640 ms

Если вы можете терпеть периодическое обновление удаленных данных в локальной базе данных, то преимущество в производительности может быть значительным.