12.11. Ограничения#

12.11. Ограничения

12.11. Ограничения #

Текущие ограничения функций текстового поиска в Tantor BE следующие:

  • Длина каждого лексемы должна быть меньше 2 килобайт

  • Длина tsvector (лексемы + позиции) должна быть меньше 1 мегабайта.

  • Количество лексем должно быть меньше, чем 264

  • Значения позиций в tsvector должны быть больше 0 и не превышать 16 383

  • Расстояние совпадения в операторе <N> (FOLLOWED BY) tsquery не может быть больше 16,384

  • Не более 256 позиций на лексему

  • Количество узлов (лексем + операторов) в типе tsquery должно быть меньше 32 768.

Для сравнения, документация PostgreSQL 8.1 содержала 10 441 уникальное слово, всего 335 420 слов, и самое часто встречающееся слово postgresql упоминалось 6 127 раз в 655 документах.

Еще один пример — в архивах рассылки Tantor BE содержится 910 989 уникальных слов с 57 491 343 лексемами в 461 020 сообщениях.