ANOVA или Краскел-Уоллис: что выбрать для сравнения групп
Когда для сравнения трёх и более независимых групп брать дисперсионный анализ ANOVA, а когда — критерий Краскела-Уоллиса. С примерами, формулировками для диплома и FAQ.
У вас три и больше групп — например, студенты трёх факультетов или три уровня нагрузки — и нужно доказать, что между ними есть разница. Здесь спорят два метода: однофакторный дисперсионный анализ (ANOVA) и критерий Краскела-Уоллиса.
Оба отвечают на один вопрос — «группы реально различаются или это случайность?». Выбор между ними зависит от типа данных, их распределения и равенства дисперсий. Разберём, как не ошибиться.
В двух словах
- Дисперсионный анализ (ANOVA) сравнивает средние трёх и более групп через F-критерий Фишера. Нужен для числовых данных с нормальным распределением и равными дисперсиями.
- Критерий Краскела-Уоллиса (H-критерий) сравнивает группы по рангам (фактически — по медианам). Подходит для баллов и ненормальных данных, устойчив к выбросам.
Краскел-Уоллис — это непараметрический «аналог» однофакторного дисперсионного анализа для независимых групп. О самой разнице параметрических и непараметрических методов — в статье «Параметрические и непараметрические критерии».
Когда брать дисперсионный анализ (ANOVA)
Все условия должны выполняться вместе:
- Сравниваете три и более независимых групп (разные люди в каждой).
- Данные — числовые измерения (время, рост, баллы тестов в широкой шкале, проценты).
- Значения в группах распределены близко к нормальному (проверьте Шапиро-Уилком: p > 0,05 — нормальное).
- Дисперсии групп примерно равны (однородность; проверяют тестом Левена).
Пример. У трёх групп спортсменов с разным режимом тренировок замерили время бега на 1000 м. Время — числовое измерение, распределение нормальное, разброс в группах схож → однофакторный ANOVA.
Когда брать Краскела-Уоллиса
Берите его, если верно хотя бы одно:
- данные — баллы анкеты, оценки, ранги (порядковая шкала);
- значения в группах распределены ненормально (выбросы, перекос);
- дисперсии групп заметно различаются (нет однородности);
- выборки маленькие, и нормальность не подтверждается.
Пример. У студентов трёх факультетов замерили уровень тревожности в баллах по анкете. Это порядковые баллы → Краскел-Уоллис.
Сомневаетесь между методами для балльной анкеты? Берите Краскела-Уоллиса — он корректен и для нормальных данных тоже, а вот ANOVA к выраженно ненормальным баллам неприменим.
Чем отличаются по сути
- ANOVA сравнивает средние групп: смотрит, насколько разброс между группами больше разброса внутри них. Отношение этих разбросов и есть F-критерий Фишера. Один выброс сильно сдвигает среднее — и результат может «поплыть».
- Краскел-Уоллис объединяет все наблюдения в один ряд, ранжирует их и сравнивает средние ранги групп — фактически их медианы. Выбросы почти не влияют, поэтому он устойчивее.
Простая логика: ANOVA работает со средними и дисперсиями, Краскел-Уоллис — с рангами.
Важное замечание: три группы, а не две
Оба метода — для трёх и более групп. Если групп всего две, ANOVA и Краскел-Уоллис применять не нужно — берут более простые методы:
- критерий Стьюдента — для двух числовых нормальных групп;
- критерий Манна-Уитни — для двух групп с баллами или ненормальными данными. О выборе между Краскелом и Манна-Уитни — статья «Манна-Уитни или Краскел-Уоллис».
И ANOVA, и Краскел-Уоллис — для независимых групп, то есть когда в каждой группе разные люди.
Не «дробите» сравнение трёх групп на несколько попарных тестов Стьюдента или Манна-Уитни — так растёт вероятность ложного результата. Сначала примените общий критерий (ANOVA или Краскел), и только если он значим — переходите к попарным сравнениям.
Что писать в дипломе
После расчёта главный показатель — p-значение (подробнее в статье «Что такое p-значение»):
- p < 0,05 — различия между группами статистически значимы;
- p > 0,05 — значимых различий нет.
Примеры формулировок:
- «Различия между группами по уровню тревожности статистически значимы (H = 9,4; p < 0,05)».
- «Статистически значимых различий между группами не выявлено (F = 1,2; p = 0,31)».
Для ANOVA приводят средние по группам и значение F; для Краскела-Уоллиса — медианы и значение H.
В тексте обязательно указывайте сам критерий, его статистику (F или H), число групп и наблюдений и p-значение — без этого вывод «группы различаются» не считается доказанным.
Что делать, если критерий значим — постхок-анализ
Общий критерий говорит только, что различия где-то есть, но не уточняет, между какими именно группами. Чтобы это выяснить, проводят попарные сравнения (постхок):
- после ANOVA — критерий Тьюки (Tukey HSD);
- после Краскела-Уоллиса — попарные сравнения Манна-Уитни с поправкой на множественность (например, Бонферрони).
На таблицу и рисунок в тексте ссылаются прямо: «Результаты сравнения представлены в таблице 1 и на рисунке 1».
Таблица 1 — Уровень тревожности у студентов трёх факультетов по критерию Краскела-Уоллиса (n = 60)
| Группа | n | Me (медиана) | H эмп | p | Вывод |
|---|---|---|---|---|---|
| Факультет А | 20 | 38 | 9,4 | < 0,05 | различия значимы |
| Факультет Б | 20 | 45 | 9,4 | < 0,05 | различия значимы |
| Факультет В | 20 | 52 | 9,4 | < 0,05 | различия значимы |
После таблицы — короткий вывод словами: «Уровень тревожности значимо различается между факультетами (H = 9,4; p < 0,05); по постхок-сравнениям самый высокий показатель — на факультете В».
Частые ошибки
- Применять ANOVA к балльным анкетам с перекосом. Баллы — порядковая шкала, при ненормальности корректнее Краскел-Уоллис.
- Не проверять однородность дисперсий. Для ANOVA важно, чтобы разброс в группах был схож (тест Левена); иначе — Краскел или поправка Уэлча.
- Сравнивать три группы попарными тестами без общего критерия. Это завышает риск ложной значимости — сначала ANOVA или Краскел.
- Останавливаться на значимом общем критерии. Он не говорит, какие группы различаются — нужен постхок (Тьюки или попарные Манна-Уитни с поправкой).
- Использовать ANOVA или Краскела для двух групп. Для двух групп — Стьюдент или Манна-Уитни.
Частые вопросы
Что мощнее — ANOVA или Краскел-Уоллис?
При нормальных данных с равными дисперсиями ANOVA чуть мощнее (легче находит реальные различия). При ненормальных данных или выбросах мощнее и корректнее Краскел-Уоллис.
Можно ли применить Краскела-Уоллиса к нормальным числовым данным?
Да, он останется корректным. А вот применять ANOVA к выраженно ненормальным или порядковым данным некорректно — поэтому при сомнениях безопаснее Краскел.
Сколько нужно групп и человек?
Минимум три группы. Жёсткого минимума по числу людей нет, но желательно хотя бы 5 наблюдений в каждой группе; чем больше, тем надёжнее вывод.
Как проверить нормальность и равенство дисперсий?
Нормальность — критерием Шапиро-Уилка по каждой группе (подробнее — в статье «Как проверить нормальность распределения»). Равенство дисперсий — тестом Левена.
А если групп всего две?
Тогда ANOVA и Краскел не нужны: берут критерий Стьюдента для нормальных числовых данных или Манна-Уитни для баллов и ненормальных.
Короткий алгоритм
- Сколько групп? Если две — вам нужны Стьюдент или Манна-Уитни, а не ANOVA/Краскел.
- Данные числовые, нормальные (проверка Шапиро-Уилком) и дисперсии равны (тест Левена)? → ANOVA.
- Данные — баллы/оценки, распределение ненормальное или дисперсии неравны? → Краскел-Уоллис.
- Критерий значим? → постхок: Тьюки (после ANOVA) или попарные Манна-Уитни с поправкой (после Краскела).
Короче: числа + нормальность + равные дисперсии → ANOVA; баллы, ненормальность или неравные дисперсии → Краскел-Уоллис. Для двух групп — Стьюдент или Манна-Уитни.
Что ещё почитать
- Как выбрать статистический критерий для диплома — общая схема выбора.
- Параметрические и непараметрические критерии — в чём принципиальная разница.
- Руководство по дисперсионному анализу (ANOVA) — формула F, алгоритм и пример.
- Что такое p-значение простыми словами — как читать результат.
- Калькулятор дисперсионного анализа и калькулятор Краскела-Уоллиса — посчитать онлайн.
Не уверены в выборе — посмотрите базу методов или закажите консультацию: эксперт подберёт критерий и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию