Перейти к основному содержимому
Перейти к основному содержимому

cramersV

Cramér's V (иногда называемая фи Крамера) является мерой ассоциации между двумя колонками в таблице. Результат функции cramersV варьируется от 0 (что соответствует отсутствию ассоциации между переменными) до 1 и может достигать 1 только тогда, когда каждое значение полностью определяется другим. Это можно рассматривать как ассоциацию между двумя переменными в процентах от их максимального возможного отклонения.

примечание

Для версии Cramér's V с коррекцией на смещение см. cramersVBiasCorrected

Синтаксис

cramersV(column1, column2)

Параметры

  • column1: первая колонка для сравнения.
  • column2: вторая колонка для сравнения.

Возвращаемое значение

  • значение в диапазоне от 0 (соответствующее отсутствию ассоциации между значениями колонок) до 1 (полная ассоциация).

Тип: всегда Float64.

Пример

Следующие две колонки, сравниваемые ниже, не имеют ассоциации друг с другом, поэтому результат cramersV равен 0:

Запрос:

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );

Результат:

┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

Следующие две колонки ниже имеют довольно близкую ассоциацию, поэтому результат cramersV имеет высокое значение:

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    );

Результат:

┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘