Размер эффекта простыми словами: d Коэна, r и η²
Что такое размер эффекта в статистике, чем он отличается от p-значения, формула d Коэна, уровни малый/средний/большой и что писать в дипломе. С таблицей и FAQ.
Вы посчитали критерий, получили p < 0,05 и написали «различия значимы». Но рецензент спрашивает: «А насколько они велики?» Ответить на это p-значение не может — оно говорит только, есть ли различие, а не насколько оно сильное. Для этого считают размер эффекта.
Разберём простыми словами, что это за показатель, какие меры бывают (d Коэна, r, η²), как их интерпретировать и что приводить в дипломе.
Зачем нужен размер эффекта помимо p-значения
p-значение отвечает на вопрос «реально различие или это случайность?». Но оно сильно зависит от объёма выборки: чем больше человек вы измерили, тем легче получить «значимый» результат — даже если различие крошечное и на практике ничего не значит.
Размер эффекта показывает другое — величину различия или связи, то есть его практическую значимость. И главное: он не зависит от объёма выборки.
При большой выборке даже ничтожное различие может оказаться статистически значимым (p < 0,05), хотя размер эффекта при этом малый. Поэтому в дипломе приводят и p-значение, и размер эффекта — вместе они дают полную картину.
Проще говоря: p отвечает «есть ли эффект?», а размер эффекта — «большой ли он?». Это два разных вопроса, и для серьёзной работы нужны оба ответа.
Пример. В выборке из 5000 человек различие средних в 0,3 балла даёт p < 0,001 — формально «высокозначимо». Но размер эффекта d = 0,05 — мизерный. Вывод честнее звучит так: различие значимо статистически, но практически пренебрежимо.
Основные меры размера эффекта
Какую меру брать — зависит от метода, которым вы анализировали данные.
- d Коэна — для сравнения двух средних (критерий Стьюдента). Показывает, на сколько стандартных отклонений различаются группы.
- r (коэффициент корреляции) — для связи двух признаков (корреляция Пирсона). Сам по себе уже является размером эффекта. Для непараметрики (Манна-Уитни, Вилкоксона) его получают по формуле r = Z/√N.
- η² (эта-квадрат) — для дисперсионного анализа (ANOVA, сравнение 3+ групп). Показывает долю объяснённой дисперсии.
Размер эффекта — это всегда дополнение к критерию, а не его замена. Сначала вы выбираете и считаете сам критерий (см. «Как выбрать статистический критерий»), и только потом — соответствующую ему меру эффекта.
Формулы размера эффекта
Считать вручную не нужно — калькуляторы StatBlank выдают размер эффекта вместе с p-значением. Но для защиты полезно понимать формулы.
d Коэна (две средних)
d = (M₁ − M₂) / s_объединённое
где M₁ и M₂ — средние двух групп, а s_объединённое (pooled) — общее стандартное отклонение. То есть d измеряет разрыв средних в единицах стандартного отклонения: d = 1 значит, что группы разошлись ровно на одно s.
r (связь / непараметрика)
Для корреляции r — это и есть сам коэффициент Пирсона или Спирмена. Для ранговых критериев (Манна-Уитни, Вилкоксона) размер эффекта считают через z-статистику:
r = Z / √N
где Z — стандартизованная статистика критерия, N — общее число наблюдений.
η² (эта-квадрат, ANOVA)
η² = SS_эффекта / SS_общая
где SS_эффекта — межгрупповая сумма квадратов, SS_общая — общая. По сути η² — это доля разброса, которую объясняет различие между группами (от 0 до 1, или 0–100%).
Как интерпретировать: уровни размера эффекта
У каждой меры есть привычные пороги «малый / средний / большой» (ориентиры Коэна). Сверяйтесь с таблицей 1.
Таблица 1 — Уровни размера эффекта для основных мер
| Мера | Метод | Малый | Средний | Большой |
|---|---|---|---|---|
| d Коэна | сравнение двух средних (Стьюдент) | 0,2 | 0,5 | 0,8 |
| r | корреляция; непараметрика (r = Z/√N) | 0,1 | 0,3 | 0,5 |
| η² (эта-квадрат) | дисперсионный анализ (ANOVA) | 0,01 | 0,06 | 0,14 |
Пороги — это ориентиры, а не жёсткие границы. Значение d = 0,79 не «хуже» 0,8 — это практически тот же большой эффект. Наглядно шкала уровней показана на рисунке 1.
Что писать в дипломе
Правило простое: рядом с результатом критерия указывайте и p-значение, и размер эффекта с интерпретацией. Готовые формулировки:
- «Различия между группами статистически значимы (t = 3,78; p < 0,05), размер эффекта большой (d = 0,84)».
- «Обнаружена значимая связь между показателями (r = 0,32; p < 0,05) — связь умеренной силы (средний размер эффекта)».
- «Влияние фактора статистически значимо (F = 5,2; p < 0,01), доля объяснённой дисперсии средняя (η² = 0,08)».
Если эффект получился малым, это не «провал» работы. Честно напишите: «различия значимы, но размер эффекта малый (d = 0,18), что говорит о небольшой практической выраженности». Такой вывод грамотнее, чем умолчать о величине эффекта.
Частые ошибки
- Приводить только p, без размера эффекта. На защите почти всегда спрашивают про величину эффекта — заранее посчитайте d, r или η².
- Путать значимость с величиной. «p < 0,001» не означает «эффект огромный». Это разные вещи: маленькое p бывает при крошечном эффекте на большой выборке.
- Брать не ту меру. Для двух средних — d Коэна, для связи — r, для трёх и более групп — η². Не считайте d там, где данные ранговые.
- Сравнивать пороги между мерами. d = 0,5 и r = 0,5 — это разные уровни (средний эффект и большой соответственно). У каждой меры своя шкала из таблицы 1.
- Игнорировать знак. Знак d или r показывает направление (какая группа больше, прямая связь или обратная); для уровня эффекта важна именно величина (модуль).
Частые вопросы
Что важнее — p-значение или размер эффекта?
Они отвечают на разные вопросы и нужны оба. p — есть ли эффект, размер эффекта — насколько он велик. В современных требованиях к работам приводят оба показателя.
Может ли быть значимый результат с малым размером эффекта?
Да, и это типично для больших выборок. Различие реально (p < 0,05), но настолько мало, что практически не важно. Поэтому одного p недостаточно.
Как посчитать размер эффекта, если данные ненормальные?
Для ранговых критериев (Манна-Уитни, Вилкоксона) используют r = Z/√N. Для связи берут коэффициент Спирмена — он сам является размером эффекта.
Зависит ли размер эффекта от числа испытуемых?
Нет. В этом его главное преимущество перед p-значением: добавив больше людей, вы уменьшите p, но размер эффекта в среднем останется тем же.
Что такое «cohen's d» и «эта-квадрат» — это одно и то же?
Нет. d Коэна (cohen's d) — для сравнения двух средних, измеряется в стандартных отклонениях. η² (эта-квадрат) — для ANOVA, это доля объяснённой дисперсии. Разные меры для разных методов.
Бывает ли d больше 1 или η² близкий к 1?
Да. d не ограничен сверху — d = 1,2 значит, что группы разошлись больше чем на одно стандартное отклонение (очень большой эффект). η² теоретически доходит до 1 (100% разброса объяснено), но на практике в дипломах редко превышает 0,2–0,3.
Итог
Размер эффекта показывает величину различия или связи и, в отличие от p-значения, не зависит от объёма выборки. Для двух средних берут d Коэна (0,2 / 0,5 / 0,8), для связи — r (0,1 / 0,3 / 0,5), для ANOVA — η² (0,01 / 0,06 / 0,14). В дипломе указывают критерий, p-значение и размер эффекта с интерпретацией — это и есть полный, защитимый вывод.
Что ещё почитать
- Что такое p-значение простыми словами — про второй обязательный показатель.
- Критерий Стьюдента: полное руководство — где d Коэна считается в паре с t.
- Дисперсионный анализ (ANOVA): руководство — где размер эффекта считают как η² (эта-квадрат).
- Параметрические и непараметрические критерии — когда размер эффекта считают через r = Z/√N.
- Корреляция Пирсона или Спирмена — где сам коэффициент r и есть размер эффекта.
- Как выбрать статистический критерий — чтобы сначала верно подобрать метод.
Подобрать меру эффекта под свой метод поможет база методов, а посчитать всю статистику под ключ — консультация эксперта.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию