U, H или ANOVA: как число групп определяет критерий
Сколько групп сравниваете — две или три и больше? Показываем, как из этого и типа данных однозначно вытекает нужный критерий: Стьюдент, Манна-Уитни, ANOVA или Краскел-Уоллис. С примерами и FAQ.
Перед сравнением групп в дипломе вы каждый раз решаете одну и ту же задачу: какой критерий взять. Кажется, что вариантов много и легко запутаться. На самом деле выбор почти всегда сводится к двум вопросам.
Первый — сколько групп вы сравниваете: две или три и больше. Второй — что за данные и нормально ли они распределены. Ответите на оба — и критерий определится сам. Дальше разберём эту логику по шагам, с примерами и готовыми формулировками.
В двух словах
Сначала считаем группы, потом смотрим на данные:
- Две группы, числа с нормальным распределением → критерий Стьюдента.
- Две группы, баллы или ненормальные данные → критерий Манна-Уитни.
- Три группы и больше, числа с нормальным распределением → дисперсионный анализ (ANOVA).
- Три группы и больше, баллы или ненормальные данные → критерий Краскела-Уоллиса.
Это четыре «рабочие лошадки» для независимых групп — то есть когда в группах разные люди. Если же вы измеряете одних и тех же людей несколько раз (до/после), критерии другие — о них чуть ниже.
Шаг 1. Считаем группы
Группа — это набор людей, которых вы сравниваете с другими по какому-то признаку. Контрольная и экспериментальная — две группы. Новички, разрядники и мастера спорта — три группы. Классы «А», «Б» и «В» — тоже три.
Здесь важно одно различие, которое студенты часто пропускают.
- Независимые группы. В каждой группе — свои, разные люди. Контрольная и экспериментальная из разных студентов; мужчины и женщины; три возрастные подгруппы. Один человек попадает только в одну группу.
- Связанные (зависимые) замеры. Это одни и те же люди, измеренные несколько раз. До тренинга и после; в начале, середине и конце семестра.
Сначала всегда отвечайте: у меня разные группы людей или один и тот же человек измерен несколько раз? От этого зависит вся ветка критериев. Перепутать их — классическая ошибка, из-за которой потом «не сходится» вся статистика в работе.
Дальше в разделах про две и три группы мы по умолчанию говорим про независимые группы (разные люди). Случай «одни и те же люди несколько раз» вынесен в отдельный раздел.
Шаг 2. Смотрим на данные
Когда с числом групп разобрались, остаётся понять, какие у вас данные и как они распределены. От этого зависит, брать ли «параметрический» критерий или его непараметрический аналог.
Не пугайтесь слов — смысл простой.
- Параметрический критерий (Стьюдент, ANOVA) работает с самими числами и со средними значениями. Он точнее, но требует, чтобы данные были числовыми измерениями (рост, время, давление, пульс) и распределялись близко к нормальному — то есть основная масса значений группируется вокруг среднего, без сильных перекосов и выбросов.
- Непараметрический критерий (Манна-Уитни, Краскел-Уоллис) работает с рангами — то есть с порядком, кто за кем по величине. Ему всё равно, нормальные ли данные, и он спокойно принимает баллы анкет и оценки.
Простое правило-ориентир: если данные — это баллы психологического опросника или порядковые оценки, почти всегда берите непараметрику (Манна-Уитни или Краскел-Уоллиса). Параметрические критерии для баллов формально некорректны, хотя на практике их часто (ошибочно) применяют.
Нормальность распределения проверяют отдельным критерием — Шапиро-Уилка: если p > 0,05, распределение можно считать нормальным. Подробнее — в статье «Как проверить нормальность распределения». А про саму разницу подходов есть отдельный разбор «Параметрические и непараметрические критерии».
Когда брать критерии для двух групп
Если групп ровно две (например, контрольная и экспериментальная) — выбор между двумя критериями.
- Стьюдент. Сравнивает средние двух групп. Берите, если данные числовые, а в каждой группе распределение близко к нормальному. Это независимый (двухвыборочный) критерий Стьюдента.
- Манна-Уитни. Сравнивает группы по рангам. Берите для баллов, оценок или когда данные ненормальные, есть выбросы, а выборка небольшая.
Пример. Сравниваете средний результат прыжка в длину у спортсменов двух секций (две группы, числа). Распределение в обеих группах нормальное → критерий Стьюдента.
Пример. Сравниваете уровень тревожности у юношей и девушек по шкале Спилбергера-Ханина (две группы, баллы анкеты) → критерий Манна-Уитни.
Этой паре посвящена отдельная статья — «Стьюдент или Манна-Уитни», там разбор подробнее.
Когда брать критерии для трёх групп и больше
Если групп три и больше (новички / разрядники / мастера; классы «А» / «Б» / «В»), пара меняется, но логика та же.
- ANOVA (дисперсионный анализ). Параметрический критерий: сравнивает средние сразу во всех группах и отвечает на вопрос «отличается ли хоть одна группа от остальных». Берите для числовых нормальных данных. Считается в калькуляторе ANOVA.
- Краскел-Уоллис. Непараметрический «аналог ANOVA»: сравнивает три группы и больше по рангам. Берите для баллов и ненормальных данных. Это критерий Краскела-Уоллиса.
Пример. Сравниваете выносливость (результат теста Купера, метры — это число) у трёх возрастных групп бегунов. Данные числовые и нормальные → ANOVA.
Пример. Сравниваете уровень школьной мотивации (баллы по методике Лускановой) в трёх классах. Это баллы → Краскел-Уоллис.
Про выбор внутри этой пары — статья «Манна-Уитни или Краскел-Уоллис» (как непараметрика для 2 и 3+ групп связана) и «ANOVA или Краскел-Уоллис».
Важно понимать, что́ именно отвечают эти два критерия. ANOVA и Краскел-Уоллис говорят только: «различия между группами есть» или «их нет». Они не уточняют, какие именно группы отличаются друг от друга — для этого после значимого результата делают апостериорные (post hoc) сравнения. Но для диплома часто достаточно и общего вывода о наличии различий.
Связанные замеры: один и тот же человек несколько раз
Отдельная ситуация — когда вы измеряете одних и тех же людей по нескольку раз. Здесь четыре «рабочие лошадки» выше не подходят, нужны их «парные» версии.
- Два замера (до / после). Числа нормальные → парный критерий Стьюдента. Баллы или ненормальные данные → критерий Вилкоксона. Подробно — в статье «Стьюдент или Вилкоксон».
- Три замера и больше (начало / середина / конец). Числа нормальные → ANOVA для повторных измерений. Баллы или ненормальные данные → критерий Фридмана. Сравнение Фридмана и Вилкоксона — в статье «Фридман или Вилкоксон».
Логика зеркальная: Вилкоксон — это «связанный Манна-Уитни», а Фридман — «связанный Краскел-Уоллис». Поменялись только люди: вместо разных групп — одни и те же, измеренные несколько раз.
Полная схема выбора
Соберём всё вместе. Сначала вопрос про людей (разные группы или одни и те же), затем про число групп/замеров, затем про данные. Схема ниже ведёт от вопросов к конкретному критерию.
Видно главное: тип данных (числа против баллов) лишь выбирает критерий внутри пары, а саму пару задаёт число групп и тип выборок. Поэтому считать группы стоит первым делом.
Почему нельзя сравнивать три группы попарными Стьюдентами
Самый частый соблазн при трёх группах — не разбираться с ANOVA, а просто прогнать критерий Стьюдента три раза: А с Б, А с В, Б с В. Так делать нельзя, и вот почему.
Каждое сравнение Стьюдента допускает 5% риск ошибиться — посчитать различие значимым там, где его на самом деле нет (это уровень значимости 0,05). Когда сравнений несколько, эти риски складываются, и шанс «поймать» хотя бы одно ложное различие резко растёт.
Таблица 1 — Как растёт риск ложного результата при множественных сравнениях Стьюдента
| Число групп | Сколько пар сравнивать | Риск хотя бы одной ложной находки |
|---|---|---|
| 2 | 1 | около 5% |
| 3 | 3 | около 14% |
| 4 | 6 | около 26% |
| 5 | 10 | около 40% |
Как видно из таблицы 1, уже для трёх групп вероятность ложного вывода почти втрое выше заявленных 5%, а для пяти групп — близка к каждому второму случаю. Поэтому при трёх и более группах берут один общий критерий — ANOVA или Краскел-Уоллиса, который держит риск под контролем.
«Прогнать все пары Стьюдентом» — заманчиво, но это методическая ошибка: вы раздуваете вероятность ложного «есть различия». Это и называется проблемой множественных сравнений. Для трёх групп и больше используйте ANOVA или Краскел-Уоллиса. Подробнее об ошибочных выводах — в статье «Ошибки первого и второго рода».
Что писать в дипломе
Главный показатель после расчёта — p-значение (как его читать — в статье «Что такое p-значение»):
- p < 0,05 — различия статистически значимы;
- p > 0,05 — значимых различий нет.
Готовые формулировки под каждый критерий:
- «Различия среднего результата между группами статистически значимы (t = 2,8; p < 0,05)» — для Стьюдента.
- «Уровень тревожности в группах статистически значимо различается (U = 132; p < 0,05)» — для Манна-Уитни.
- «Выявлены статистически значимые различия выносливости между тремя группами (F = 5,1; p < 0,05)» — для ANOVA.
- «Различия мотивации между классами статистически значимы (H = 9,4; p < 0,05)» — для Краскела-Уоллиса.
В тексте всегда указывайте сам критерий, его статистику (t, U, F или H), число наблюдений и p-значение. Для параметрических критериев добавьте средние по группам, для непараметрических — медианы. Без этого вывод «группы различаются» не считается доказанным.
Частые ошибки
- Сравнивать три группы попарными Стьюдентами вместо ANOVA. Раздувает риск ложного результата (см. таблицу 1 выше).
- Применять Стьюдента и ANOVA к баллам анкет. Баллы — порядковая шкала, корректнее Манна-Уитни и Краскел-Уоллис. Про шкалы — статья «Шкалы измерения».
- Путать независимые и связанные выборки. Для «одних и тех же людей дважды» нужен не Манна-Уитни, а Вилкоксон; не Краскел-Уоллис, а Фридман.
- Не проверять нормальность перед параметрическим критерием. Перед Стьюдентом и ANOVA проверяйте распределение Шапиро-Уилком.
- Делать вывод по одному среднему «у них больше». Без критерия и p-значения это не доказательство.
Частые вопросы
А если групп две, но данные ненормальные?
Тогда берите Манна-Уитни. Число групп (две) задаёт пару «Стьюдент / Манна-Уитни», а ненормальность данных выбирает внутри пары непараметрический вариант — Манна-Уитни.
ANOVA показала различия. Как понять, какие именно группы отличаются?
Сама по себе ANOVA этого не говорит — она лишь фиксирует, что «где-то различия есть». Чтобы узнать, между какими конкретно группами, делают апостериорные (post hoc) сравнения. Для диплома часто достаточно общего вывода о наличии различий плюс таблицы средних по группам.
Можно ли применить Краскел-Уоллиса к нормальным числовым данным?
Да, он останется корректным — просто будет чуть менее чувствительным, чем ANOVA. А вот наоборот (ANOVA к баллам) — некорректно. Поэтому при сомнениях для трёх групп безопаснее Краскел-Уоллис.
У меня две группы и три замера во времени одновременно. Что делать?
Это уже сложный план с двумя факторами (группа и время) — его считают через двухфакторную ANOVA. Такие случаи лучше обсудить с научным руководителем или заказать консультацию: подбор критерия зависит от деталей дизайна.
Сколько человек нужно в каждой группе?
Жёсткого минимума нет, но для устойчивого вывода желательно хотя бы по 15–30 человек в группе, а для ANOVA — сопоставимые по размеру группы. Подробнее — в статье «Сколько респондентов нужно для диплома».
Короткий алгоритм
- Разные люди или одни и те же? Разные группы → независимые критерии (ниже). Одни и те же измерены несколько раз → связанные (Вилкоксон / Фридман).
- Сколько групп? Две → пара «Стьюдент / Манна-Уитни». Три и больше → пара «ANOVA / Краскел-Уоллис».
- Что за данные? Числа с нормальным распределением (проверка Шапиро-Уилком) → параметрический критерий из пары (Стьюдент или ANOVA). Баллы или ненормальные данные → непараметрический (Манна-Уитни или Краскел-Уоллис).
Короче: число групп задаёт пару критериев, тип данных выбирает внутри пары. 2 группы → Стьюдент или Манна-Уитни; 3+ группы → ANOVA или Краскел-Уоллис. И никогда не заменяйте ANOVA пачкой попарных Стьюдентов.
Что ещё почитать
- Как выбрать статистический критерий для диплома — общая схема выбора на все случаи.
- Манна-Уитни или Краскел-Уоллис — непараметрика для 2 и 3+ групп.
- Параметрические и непараметрические критерии — в чём принципиальная разница подходов.
- Как проверить нормальность распределения — чтобы решить, можно ли брать параметрический критерий.
- Калькулятор ANOVA и калькулятор Краскела-Уоллиса — посчитать онлайн.
Не уверены, что подобрали критерий правильно — загляните в базу методов или закажите консультацию: эксперт подберёт критерий под ваш дизайн и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию