Дисперсионный анализ (ANOVA): полное руководство с формулами и примером
Что такое дисперсионный анализ простыми словами: когда применять для 3+ групп, идея, F-критерий Фишера, формула, степени свободы, ANOVA-таблица, пример, постхок и FAQ.
Дисперсионный анализ (ANOVA) — главный метод, когда в дипломе нужно сравнить средние не двух, а сразу трёх и более групп: например, успеваемость на трёх курсах или эффект трёх методик обучения. Стьюдент тут уже не годится — попарные сравнения накапливают ошибку.
В этом руководстве разберём всё по порядку: что такое дисперсионный анализ простыми словами, в чём его идея, формула F-критерия Фишера и степени свободы, условия применения, пошаговый алгоритм, разобранный пример с ANOVA-таблицей, постхок-сравнения и частые вопросы.
Если нужно просто посчитать — воспользуйтесь онлайн-калькулятором дисперсионного анализа. А здесь — теория, чтобы уверенно защититься.
Что такое дисперсионный анализ простыми словами
Дисперсионный анализ (ANOVA, от англ. Analysis of Variance) — это параметрический метод, который проверяет, значимо ли различаются средние значения трёх и более групп. Он отвечает на вопрос: «Эти группы действительно отличаются по среднему — или разброс между ними случайный?»
Несмотря на название («анализ дисперсий»), ANOVA сравнивает именно средние. Парадокс снимается просто: чтобы понять, далеко ли разошлись средние групп, метод сопоставляет два вида разброса — между группами и внутри них.
Однофакторный дисперсионный анализ (one-way ANOVA) — это обобщение критерия Стьюдента на случай, когда групп больше двух. Для двух групп используют именно Стьюдента, а ANOVA нужен начиная с трёх.
Дисперсионный анализ — параметрический метод: он требует количественных данных и близкого к нормальному распределения. Если данные — баллы анкет или распределение ненормальное, нужен непараметрический аналог — критерий Краскела-Уоллиса.
Когда применять дисперсионный анализ
Однофакторный ANOVA подходит, когда одновременно выполнены условия:
- Три и более независимые группы — разные люди в каждой группе (например, три разных курса или три метода).
- Данные — количественные измерения (баллы 0–100, время, рост, число).
- Сравниваются именно средние этих групп.
- Распределение в группах близко к нормальному, а дисперсии примерно равны.
Нельзя сравнивать три группы попарно несколькими t-критериями Стьюдента: при каждом сравнении накапливается риск ложного результата. Для 3+ групп — один общий тест ANOVA. Подробнее о выборе — в статье «Как выбрать статистический критерий».
Идея метода: межгрупповая и внутригрупповая дисперсия
Вся суть ANOVA — в разложении общей изменчивости на две части.
- Межгрупповая изменчивость — насколько различаются средние самих групп (отражает эффект фактора).
- Внутригрупповая изменчивость — случайный разброс значений внутри каждой группы (отражает «шум»).
Логика такая: если средние групп разошлись сильнее, чем колеблются значения внутри групп, — различия неслучайны. F-критерий и есть отношение этих двух разбросов.
Чем больше межгрупповая дисперсия по сравнению с внутригрупповой, тем больше F и тем вероятнее, что группы реально различаются. Если же разброс между группами не превышает «шум» внутри них — F близок к 1, и различий нет.
Гипотезы дисперсионного анализа
- H₀ (нулевая гипотеза дисперсионного анализа): все групповые средние равны (μ₁ = μ₂ = μ₃ = …), различия случайны.
- H₁ (альтернативная): хотя бы одно среднее отличается от остальных.
Важно: ANOVA говорит лишь, что различие где-то есть, но не указывает, какие именно группы отличаются. Это определяет постхок (см. ниже).
Формула F-критерия и степени свободы
F-критерий назван в честь британского статистика Рональда Фишера (отсюда — «дисперсионный анализ, критерий Фишера»). Считать вручную не обязательно — всё делает калькулятор. Но для защиты полезно знать суть.
Эмпирическое значение F — это отношение межгруппового среднего квадрата к внутригрупповому:
F = MS_межгр / MS_внутригр = (SS_b / df_b) / (SS_w / df_w)
где SS — суммы квадратов (sum of squares), MS — средние квадраты (mean square), а индексы b (between) и w (within) — «между группами» и «внутри групп».
Средние квадраты получают делением сумм квадратов на степени свободы:
- df межгрупповая:
df_b = k − 1, где k — число групп; - df внутригрупповая:
df_w = N − k, где N — общее число наблюдений.
Правило вывода: различия значимы, когда F эмп ≥ F крит (что эквивалентно p < 0,05). Тогда хотя бы две группы различаются — какие именно, покажет постхок-критерий (например, критерий Тьюки).
Условия применения (допущения)
Чтобы результат ANOVA был корректным, проверяют три допущения:
- Нормальность распределения в группах (или остатков) — например, критерием Шапиро-Уилка; p > 0,05 говорит о нормальности. Как это сделать — в статье «Как проверить нормальность распределения».
- Однородность (равенство) дисперсий — тестом Левена; если p > 0,05, дисперсии можно считать равными.
- Независимость наблюдений — группы из разных людей, измерения не связаны.
Если нормальность или однородность дисперсий нарушены, переходят на непараметрический критерий Краскела-Уоллиса.
Алгоритм расчёта: как считать
Разберём шаги подробнее:
- Средние. Считаем общее среднее по всем наблюдениям и среднее каждой группы.
- Суммы квадратов. SS_b — взвешенная сумма квадратов отклонений групповых средних от общего; SS_w — сумма квадратов отклонений значений от своих групповых средних.
- Степени свободы. df_b = k − 1, df_w = N − k.
- Средние квадраты и F. MS = SS / df для каждой строки, затем F = MS_b / MS_w.
- Сравнение. Сравниваем F эмп с F крит по df_b и df_w: если F эмп ≥ F крит (p < 0,05) — различия значимы.
Разбор примера с ANOVA-таблицей
Сравним успешность выполнения задания в трёх группах по 4 человека (баллы):
- Группа 1: 4, 5, 4, 3 → M₁ = 4,0
- Группа 2: 6, 7, 5, 6 → M₂ = 6,0
- Группа 3: 8, 9, 7, 8 → M₃ = 8,0
Всего N = 12 наблюдений, k = 3 группы. Общее среднее = (4 + 6 + 8) / 3 = 6,0.
Межгрупповая сумма квадратов (по 4 значения в группе):
SS_b = 4·[(4−6)² + (6−6)² + (8−6)²] = 4·(4 + 0 + 4) = 32
Внутригрупповая сумма квадратов (отклонения внутри каждой группы):
SS_w = 2 + 2 + 2 = 6
(в каждой группе отклонения от среднего дают сумму квадратов 2).
Степени свободы: df_b = k − 1 = 2; df_w = N − k = 12 − 3 = 9.
Средние квадраты: MS_b = 32 / 2 = 16; MS_w = 6 / 9 ≈ 0,667.
F-критерий: F = 16 / 0,667 ≈ 24,0.
Сведём всё в стандартную таблицу дисперсионного анализа.
Таблица 1 — Таблица дисперсионного анализа (k = 3, N = 12)
| Источник вариации | SS | df | MS | F | F крит (p ≤ 0,05) |
|---|---|---|---|---|---|
| Межгрупповая (фактор) | 32 | 2 | 16 | 24,0 | 4,26 |
| Внутригрупповая (ошибка) | 6 | 9 | 0,667 | — | — |
| Общая | 38 | 11 | — | — | — |
Критическое значение F крит(0,05; 2; 9) = 4,26. Сравниваем: 24,0 ≥ 4,26 → различия статистически значимы (p < 0,05).
Вывод для диплома: «Между группами выявлены статистически значимые различия по уровню показателя (F = 24,0; df = 2; 9; p < 0,05): средние составили 4,0; 6,0 и 8,0 балла соответственно».
Постхок-сравнения: критерий Тьюки
ANOVA показал, что различия есть, но не уточнил, между какими именно группами. Чтобы выяснить это, проводят постхок-сравнения (post hoc — «после того»).
Самый распространённый — критерий Тьюки (Tukey HSD). Он попарно сравнивает все группы и при этом контролирует общую ошибку, поэтому безопаснее серии t-тестов. В нашем примере Тьюки покажет, что значимо различаются все три пары (1–2, 2–3, 1–3).
Постхок проводят только если общий F значим. Если ANOVA не нашёл различий (p > 0,05), попарные сравнения не делают.
Однофакторный и двухфакторный ANOVA
- Однофакторный (one-way) дисперсионный анализ оценивает влияние одного фактора (например, «метод обучения» с тремя уровнями).
- Двухфакторный (two-way) дисперсионный анализ оценивает влияние двух факторов сразу (например, «метод» и «пол») и, что важно, их взаимодействие — усиливает ли один фактор эффект другого.
В дипломах чаще всего нужен именно однофакторный вариант. Двухфакторный берут, когда в дизайне исследования заложены два независимых фактора.
Непараметрический аналог: критерий Краскела-Уоллиса
Если данные не количественные (баллы анкет, ранги) или распределение далеко от нормального, ANOVA применять нельзя — используют его непараметрический аналог, критерий Краскела-Уоллиса. Он сравнивает те же 3+ независимые группы, но работает с рангами, а не со средними.
Что выбрать в спорном случае — разобрано в статье «ANOVA или Краскел-Уоллис». О разнице между двумя семействами методов — «Параметрические и непараметрические критерии».
Дисперсионный анализ в SPSS, Excel и онлайн
- В SPSS: «Анализ» → «Сравнение средних» → «Однофакторный дисперсионный анализ» (One-Way ANOVA); там же задаются тест Левена и постхок (Tukey). Программа выдаёт ANOVA-таблицу и p-значение.
- В Excel: надстройка «Анализ данных» → «Однофакторный дисперсионный анализ» строит таблицу с SS, df, MS, F и F крит. Но Excel не проверяет нормальность и не делает постхок — это нужно отдельно.
- Онлайн проще всего: калькулятор дисперсионного анализа сам считает SS, df, MS и F, берёт критическое значение, выдаёт p и готовый вывод.
Частые ошибки
- Сравнивать 3+ группы попарно Стьюдентом. Это накапливает ошибку — нужен один общий ANOVA.
- Применять ANOVA к балльным анкетам и ненормальным данным. Тогда корректнее Краскел-Уоллис.
- Не проверять условия (нормальность, равенство дисперсий) перед расчётом.
- Делать выводы о конкретных группах без постхока. Значимый F говорит лишь, что различие где-то есть.
- Использовать ANOVA для двух групп. Для двух групп — критерий Стьюдента.
Частые вопросы
Что такое дисперсионный анализ простыми словами?
Это метод, который проверяет, реально ли различаются средние трёх и более групп или разброс между ними случаен. Он сравнивает изменчивость между группами с изменчивостью внутри них.
Чем ANOVA отличается от критерия Стьюдента?
Стьюдент сравнивает средние двух групп, а ANOVA — трёх и более сразу, одним тестом, без накопления ошибки. Для двух групп это, по сути, эквивалентные методы (F = t²).
Что показывает F-критерий?
F — это отношение межгрупповой дисперсии к внутригрупповой. Чем он больше, тем сильнее различаются группы. Если F эмп ≥ F крит (p < 0,05), различия значимы.
Какая нулевая гипотеза в дисперсионном анализе?
H₀: все групповые средние равны (μ₁ = μ₂ = μ₃ = …). Альтернативная H₁: хотя бы одно среднее отличается от остальных.
Что делать, если данные ненормальные?
Перейти на непараметрический аналог — критерий Краскела-Уоллиса. Он сравнивает те же 3+ группы, но по рангам.
Зачем нужен постхок после ANOVA?
ANOVA говорит лишь, что различие где-то есть. Постхок (например, критерий Тьюки) показывает, какие именно пары групп различаются. Его делают только при значимом F.
Что ещё почитать
- ANOVA или Краскел-Уоллис — что брать, если данные ненормальны.
- Критерий Стьюдента: полное руководство — сравнение средних для двух групп.
- Размер эффекта (d Коэна, η²) — насколько велики различия между группами.
- Как проверить нормальность распределения — одно из условий применения ANOVA.
Итог
Дисперсионный анализ (ANOVA) сравнивает средние трёх и более независимых групп, раскладывая общую изменчивость на межгрупповую и внутригрупповую. Различия значимы, когда F эмп ≥ F крит (p < 0,05); какие именно группы отличаются, покажет постхок (Тьюки). Для ненормальных данных — Краскел-Уоллис, для двух групп — Стьюдент.
Посчитать свои данные за пару минут можно в калькуляторе дисперсионного анализа — он сам построит ANOVA-таблицу и оформит вывод. Подобрать метод под свою задачу поможет база методов, а если нужна вся статистика под ключ — консультация эксперта.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию