Перейти к основному содержимому
Перейти к основному содержимому

Манипуляции с колонками

Набор запросов, позволяющих изменять структуру таблицы.

Синтаксис:

ALTER [TEMPORARY] TABLE [db].name [ON CLUSTER cluster] ADD|DROP|RENAME|CLEAR|COMMENT|{MODIFY|ALTER}|MATERIALIZE COLUMN ...

В запросе укажите список из одного или нескольких разделенных запятыми действий. Каждое действие является операцией над колонкой.

Поддерживаются следующие действия:

  • ADD COLUMN — Добавляет новую колонку в таблицу.
  • DROP COLUMN — Удаляет колонку.
  • RENAME COLUMN — Переименовывает существующую колонку.
  • CLEAR COLUMN — Сбрасывает значения колонки.
  • COMMENT COLUMN — Добавляет текстовый комментарий к колонке.
  • MODIFY COLUMN — Изменяет тип колонки, выражение по умолчанию, TTL и настройки колонки.
  • MODIFY COLUMN REMOVE — Удаляет одно из свойств колонки.
  • MODIFY COLUMN MODIFY SETTING - Изменяет настройки колонки.
  • MODIFY COLUMN RESET SETTING - Сбрасывает настройки колонки.
  • MATERIALIZE COLUMN — Материализует колонку в частях, где колонка отсутствует. Эти действия описаны подробно ниже.

ADD COLUMN

ADD COLUMN [IF NOT EXISTS] name [type] [default_expr] [codec] [AFTER name_after | FIRST]

Добавляет новую колонку в таблицу с указанным name, type, codec и default_expr (см. раздел Выражения по умолчанию).

Если включен клаузула IF NOT EXISTS, запрос не вернет ошибку, если колонка уже существует. Если вы укажете AFTER name_after (имя другой колонки), колонка будет добавлена после указанной в списке колонок таблицы. Если вы хотите добавить колонку в начало таблицы, используйте клаузулу FIRST. В противном случае колонка будет добавлена в конец таблицы. Для цепочки действий name_after может быть именем колонки, которая добавляется в одном из предыдущих действий.

Добавление колонки просто изменяет структуру таблицы, не выполняя никаких действий с данными. Данные не появляются на диске после ALTER. Если данные отсутствуют для колонки при чтении из таблицы, они заполняются значениями по умолчанию (путем выполнения выражения по умолчанию, если оно есть, или с использованием нулей или пустых строк). Колонка появляется на диске после слияния частей данных (см. MergeTree).

Этот подход позволяет нам сразу завершить запрос ALTER, не увеличивая объем старых данных.

Пример:

ALTER TABLE alter_test ADD COLUMN Added1 UInt32 FIRST;
ALTER TABLE alter_test ADD COLUMN Added2 UInt32 AFTER NestedColumn;
ALTER TABLE alter_test ADD COLUMN Added3 UInt32 AFTER ToDrop;
DESC alter_test FORMAT TSV;
Added1  UInt32
CounterID       UInt32
StartDate       Date
UserID  UInt32
VisitID UInt32
NestedColumn.A  Array(UInt8)
NestedColumn.S  Array(String)
Added2  UInt32
ToDrop  UInt32
Added3  UInt32

DROP COLUMN

DROP COLUMN [IF EXISTS] name

Удаляет колонку с именем name. Если указана клаузула IF EXISTS, запрос не вернет ошибку, если колонка не существует.

Удаляет данные из файловой системы. Поскольку это удаляет целые файлы, запрос завершается почти мгновенно.

подсказка

Вы не можете удалить колонку, если она используется материализованным представлением. В противном случае будет возвращена ошибка.

Пример:

ALTER TABLE visits DROP COLUMN browser

RENAME COLUMN

RENAME COLUMN [IF EXISTS] name to new_name

Переименовывает колонку name в new_name. Если указана клаузула IF EXISTS, запрос не вернет ошибку, если колонка не существует. Поскольку переименование не затрагивает исходные данные, запрос завершается почти мгновенно.

ЗАМЕТКА: Колонки, указанные в ключевом выражении таблицы (либо с ORDER BY, либо с PRIMARY KEY), не могут быть переименованы. Попытка изменить эти колонки приведет к ошибке SQL Error [524].

Пример:

ALTER TABLE visits RENAME COLUMN webBrowser TO browser

CLEAR COLUMN

CLEAR COLUMN [IF EXISTS] name IN PARTITION partition_name

Сбрасывает все данные в колонке для указанной партиции. Узнайте больше о том, как указать имя партиции в разделе Как установить выражение партиции.

Если указана клаузула IF EXISTS, запрос не вернет ошибку, если колонка не существует.

Пример:

ALTER TABLE visits CLEAR COLUMN browser IN PARTITION tuple()

COMMENT COLUMN

COMMENT COLUMN [IF EXISTS] name 'Текстовый комментарий'

Добавляет комментарий к колонке. Если указана клаузула IF EXISTS, запрос не вернет ошибку, если колонка не существует.

Каждая колонка может иметь один комментарий. Если комментарий уже существует для колонки, новый комментарий заменяет предыдущий.

Комментарии хранятся в колонке comment_expression, возвращаемой запросом DESCRIBE TABLE.

Пример:

ALTER TABLE visits COMMENT COLUMN browser 'Эта колонка показывает браузер, использованный для доступа к сайту.'

MODIFY COLUMN

MODIFY COLUMN [IF EXISTS] name [type] [default_expr] [codec] [TTL] [settings] [AFTER name_after | FIRST]
ALTER COLUMN [IF EXISTS] name TYPE [type] [default_expr] [codec] [TTL] [settings] [AFTER name_after | FIRST]

Этот запрос изменяет свойства колонки name:

  • Тип

  • Выражение по умолчанию

  • Кодек сжатия

  • TTL

  • Настройки на уровне колонки

Для примеров изменения кодеков сжатия колонок см. Кодеки сжатия колонок.

Для примеров изменения TTL колонок см. TTL колонок.

Для примеров изменения настроек на уровне колонки см. Настройки на уровне колонки.

Если указана клаузула IF EXISTS, запрос не вернет ошибку, если колонка не существует.

При изменении типа значения конвертируются так, как если бы функции toType были применены к ним. Если изменяется только выражение по умолчанию, запрос не выполняет ничего сложного и завершается почти мгновенно.

Пример:

ALTER TABLE visits MODIFY COLUMN browser Array(String)

Изменение типа колонки — это единственное сложное действие — оно изменяет содержимое файлов с данными. Для больших таблиц это может занять много времени.

Запрос также может изменить порядок колонок, используя клаузу FIRST | AFTER, см. описание ADD COLUMN, но тип колонки обязателен в этом случае.

Пример:

CREATE TABLE users (
    c1 Int16,
    c2 String
) ENGINE = MergeTree
ORDER BY c1;

DESCRIBE users;
┌─name─┬─type───┬
│ c1   │ Int16  │
│ c2   │ String │
└──────┴────────┴

ALTER TABLE users MODIFY COLUMN c2 String FIRST;

DESCRIBE users;
┌─name─┬─type───┬
│ c2   │ String │
│ c1   │ Int16  │
└──────┴────────┴

ALTER TABLE users ALTER COLUMN c2 TYPE String AFTER c1;

DESCRIBE users;
┌─name─┬─type───┬
│ c1   │ Int16  │
│ c2   │ String │
└──────┴────────┴

Запрос ALTER является атомарным. Для таблиц MergeTree он также выполняется без блокировки.

Запрос ALTER для изменения колонок реплицируется. Инструкции сохраняются в ZooKeeper, затем каждая реплика применяет их. Все запросы ALTER выполняются в одном и том же порядке. Запрос ожидает завершения соответствующих действий на других репликах. Однако запрос на изменение колонок в реплицированной таблице может быть прерван, и все действия будут выполнены асинхронно.

MODIFY COLUMN REMOVE

Удаляет одно из свойств колонки: DEFAULT, ALIAS, MATERIALIZED, CODEC, COMMENT, TTL, SETTINGS.

Синтаксис:

ALTER TABLE table_name MODIFY COLUMN column_name REMOVE property;

Пример

Удалить TTL:

ALTER TABLE table_with_ttl MODIFY COLUMN column_ttl REMOVE TTL;

Смотрите Также

MODIFY COLUMN MODIFY SETTING

Изменить настройку колонки.

Синтаксис:

ALTER TABLE table_name MODIFY COLUMN column_name MODIFY SETTING name=value,...;

Пример

Изменить max_compress_block_size колонки на 1MB:

ALTER TABLE table_name MODIFY COLUMN column_name MODIFY SETTING max_compress_block_size = 1048576;

MODIFY COLUMN RESET SETTING

Сбросить настройку колонки, также удаляет объявление настройки в выражении колонки запроса CREATE таблицы.

Синтаксис:

ALTER TABLE table_name MODIFY COLUMN column_name RESET SETTING name,...;

Пример

Сбросить настройку колонки max_compress_block_size на её значение по умолчанию:

ALTER TABLE table_name MODIFY COLUMN column_name RESET SETTING max_compress_block_size;

MATERIALIZE COLUMN

Материализует колонку с выражением значения DEFAULT или MATERIALIZED. При добавлении материализованной колонки с использованием ALTER TABLE table_name ADD COLUMN column_name MATERIALIZED существующие строки без материализованных значений автоматически не заполняются. Инструкция MATERIALIZE COLUMN может быть использована для перезаписи существующих данных колонки после того, как выражение DEFAULT или MATERIALIZED было добавлено или обновлено (что обновляет только метаданные, но не изменяет существующие данные). Обратите внимание, что материализация колонки в ключе сортировки является недопустимой операцией, поскольку это может нарушить порядок сортировки. Реализовано как мутация.

Для колонок с новым или обновленным выражением значения MATERIALIZED все существующие строки перезаписываются.

Для колонок с новым или обновленным выражением значения DEFAULT поведение зависит от версии ClickHouse:

  • В ClickHouse < v24.2 все существующие строки перезаписываются.
  • В ClickHouse >= v24.2 различает, было ли значение строки в колонке с выражением значения DEFAULT явно указано при вставке или нет, т.е. рассчитано из выражения значения DEFAULT. Если значение было явно указано, ClickHouse оставляет его без изменений. Если значение было рассчитано, ClickHouse изменяет его на новое или обновленное выражение значения MATERIALIZED.

Синтаксис:

ALTER TABLE [db.]table [ON CLUSTER cluster] MATERIALIZE COLUMN col [IN PARTITION partition | IN PARTITION ID 'partition_id'];
  • Если вы укажете PARTITION, колонка будет материализована только с указанной партицией.

Пример

DROP TABLE IF EXISTS tmp;
SET mutations_sync = 2;
CREATE TABLE tmp (x Int64) ENGINE = MergeTree() ORDER BY tuple() PARTITION BY tuple();
INSERT INTO tmp SELECT * FROM system.numbers LIMIT 5;
ALTER TABLE tmp ADD COLUMN s String MATERIALIZED toString(x);

ALTER TABLE tmp MATERIALIZE COLUMN s;

SELECT groupArray(x), groupArray(s) FROM (select x,s from tmp order by x);

┌─groupArray(x)─┬─groupArray(s)─────────┐
│ [0,1,2,3,4]   │ ['0','1','2','3','4'] │
└───────────────┴───────────────────────┘

ALTER TABLE tmp MODIFY COLUMN s String MATERIALIZED toString(round(100/x));

INSERT INTO tmp SELECT * FROM system.numbers LIMIT 5,5;

SELECT groupArray(x), groupArray(s) FROM tmp;

┌─groupArray(x)─────────┬─groupArray(s)──────────────────────────────────┐
│ [0,1,2,3,4,5,6,7,8,9] │ ['0','1','2','3','4','20','17','14','12','11'] │
└───────────────────────┴────────────────────────────────────────────────┘

ALTER TABLE tmp MATERIALIZE COLUMN s;

SELECT groupArray(x), groupArray(s) FROM tmp;

┌─groupArray(x)─────────┬─groupArray(s)─────────────────────────────────────────┐
│ [0,1,2,3,4,5,6,7,8,9] │ ['inf','100','50','33','25','20','17','14','12','11'] │
└───────────────────────┴───────────────────────────────────────────────────────┘

Смотрите Также

Ограничения

Запрос ALTER позволяет вам создавать и удалять отдельные элементы (колонки) в вложенных структурах данных, но не целые вложенные структуры данных. Чтобы добавить вложенную структуру данных, вы можете добавить колонки с именем, например, name.nested_name и типом Array(T). Вложенная структура данных эквивалентна нескольким массивам колонок с именами, имеющими один и тот же префикс до точки.

Нет поддержки удаления колонок в первичном ключе или ключе выборки (колонки, которые используются в выражении ENGINE). Изменение типа для колонок, включенных в первичный ключ, возможно только в том случае, если это изменение не приводит к изменению данных (например, вам разрешено добавлять значения в Enum или изменять тип с DateTime на UInt32).

Если запрос ALTER недостаточен для внесения необходимых изменений в таблицу, вы можете создать новую таблицу, скопировать данные в неё с помощью запроса INSERT SELECT, затем переключить таблицы, используя запрос RENAME и удалить старую таблицу.

Запрос ALTER блокирует все операции чтения и записи для таблицы. Другими словами, если в момент выполнения запроса ALTER выполняется длительный SELECT, запрос ALTER будет ждать его завершения. В то же время все новые запросы к той же таблице будут ждать, пока выполняется этот ALTER.

Для таблиц, которые не хранят данные сами по себе (такие как Merge и Distributed), ALTER просто изменяет структуру таблицы и не изменяет структуру подчиненных таблиц. Например, при выполнении ALTER для Distributed таблицы вам также придется выполнить ALTER для таблиц на всех удаленных серверах.