Условие PREWHERE
PREWHERE — это оптимизация, позволяющая более эффективно применять фильтрацию. Она включена по умолчанию, даже если условие PREWHERE
не указано явно. Это работает за счет автоматического перемещения части условий WHERE на этап prewhere. Роль условия PREWHERE
заключается исключительно в контроле этой оптимизации, если вы думаете, что можете сделать это лучше, чем происходит по умолчанию.
С оптимизацией prewhere вначале читаются только те колонки, которые необходимы для выполнения выражения prewhere. Затем читаются другие колонки, которые нужны для выполнения оставшейся части запроса, но только те блоки, где выражение prewhere истинно хотя бы для некоторых строк. Если есть много блоков, где выражение prewhere ложно для всех строк, и для prewhere требуется меньше колонок, чем для других частей запроса, это часто позволяет значительно уменьшить объем данных, считываемых с диска для выполнения запроса.
Ручное управление Prewhere
Условие имеет такое же значение, как и условие WHERE
. Разница заключается в том, какие данные читаются из таблицы. При ручном управлении PREWHERE
для условий фильтрации, которые используются меньшинством колонок в запросе, но которые обеспечивают сильную фильтрацию данных. Это снижает объем данных для чтения.
Запрос может одновременно указывать PREWHERE
и WHERE
. В этом случае PREWHERE
предшествует WHERE
.
Если настройка optimize_move_to_prewhere установлена в 0, эвристика для автоматического перемещения частей выражений из WHERE
в PREWHERE
отключена.
Если запрос имеет FINAL модификатор, оптимизация PREWHERE
не всегда корректна. Она включает только в том случае, если обе настройки optimize_move_to_prewhere и optimize_move_to_prewhere_if_final включены.
Секция PREWHERE
выполняется до FINAL
, поэтому результаты запросов FROM ... FINAL
могут быть искажены при использовании PREWHERE
с полями, которые не находятся в секции ORDER BY
таблицы.
Ограничения
PREWHERE
поддерживается только таблицами из семейства *MergeTree.