12.11. Ограничения#
12.11. Ограничения #
Текущие ограничения функций текстового поиска в Tantor BE следующие:
Длина каждого лексемы должна быть меньше 2 килобайт
Длина
tsvector
(лексемы + позиции) должна быть меньше 1 мегабайта.Количество лексем должно быть меньше, чем 264
Значения позиций в
tsvector
должны быть больше 0 и не превышать 16 383Расстояние совпадения в операторе
<
(FOLLOWED BY)N
>tsquery
не может быть больше 16,384Не более 256 позиций на лексему
Количество узлов (лексем + операторов) в типе
tsquery
должно быть меньше 32 768.
Для сравнения, документация PostgreSQL 8.1 содержала 10 441 уникальное слово, всего 335 420 слов, и самое часто встречающееся слово “postgresql” упоминалось 6 127 раз в 655 документах.
Еще один пример — в архивах рассылки Tantor BE содержится 910 989 уникальных слов с 57 491 343 лексемами в 461 020 сообщениях.