Критерий Левена: проверка равенства дисперсий
Зачем критерий Левена нужен перед t-критерием и ANOVA, как читать его p-значение и что делать, если дисперсии не равны. С примерами и FAQ.
Прежде чем сравнивать средние двух или нескольких групп, статистика тихо проверяет одно скрытое условие: насколько одинаково «разбросаны» данные внутри каждой группы. Если разброс сильно разный, привычные t-критерий и ANOVA могут соврать.
Именно это и проверяет критерий Левена — простой тест, который должен стоять в вашем дипломе ещё до сравнения средних.
В двух словах
- Критерий Левена проверяет гипотезу о равенстве дисперсий (одинаковом разбросе) в группах. Дисперсия — это мера того, насколько значения «разлетаются» вокруг своего среднего.
- Смотрят на p-значение: если p > 0,05 — дисперсии можно считать равными (условие выполнено), если p < 0,05 — разброс в группах разный.
- Это входной билет для t-критерия Стьюдента и дисперсионного анализа ANOVA: оба ждут примерно одинакового разброса в группах.
Если дисперсии не равны — не беда: есть поправка Уэлча и непараметрические критерии. Об этом ниже.
Что такое «равенство дисперсий» простыми словами
Дисперсия и стандартное отклонение показывают, насколько кучно или, наоборот, разбросанно лежат значения вокруг среднего.
Представьте два класса. В обоих средний балл за контрольную — 4,0. Но в первом почти все написали на «четвёрки», а во втором половина — на «двойки», половина — на «пятёрки». Среднее одинаковое, а разброс — совершенно разный.
Пример. Группа А: 39, 40, 41, 40, 40 — все близко к среднему 40, разброс маленький. Группа Б: 20, 60, 35, 45, 40 — среднее тоже 40, но значения «разлетелись» сильно. Дисперсия у группы Б намного больше.
Гомогенность дисперсий (она же гомоскедастичность) — это просто умное название для ситуации, когда разброс в группах примерно одинаков. Критерий Левена и проверяет, выполняется ли это.
Не путайте две разные проверки. Нормальность распределения — это про форму данных внутри группы (колокол или нет). Критерий Левена — про разброс и про то, одинаков ли он между группами. Это два разных условия, и проверяют их отдельно.
Зачем он нужен перед t-критерием и ANOVA
И t-критерий Стьюдента для независимых выборок, и ANOVA сравнивают средние значения групп. Но «под капотом» они складывают разброс групп в общую оценку. Если в одной группе данные кучные, а в другой «размазаны», эта общая оценка получается кривой — и вывод о различии средних становится ненадёжным.
Поэтому порядок действий в дипломе такой:
- Проверяете нормальность в каждой группе (Шапиро-Уилк).
- Проверяете равенство дисперсий критерием Левена.
- И только потом выбираете и считаете сам критерий сравнения средних.
В большинстве учебников t-критерий Стьюдента описывают именно в варианте «с равными дисперсиями». Поэтому проверку Левена удобно вставлять прямо перед расчётом: она показывает, имеете ли вы право использовать классическую формулу или нужна поправка Уэлча.
Как читать результат: p-значение
Критерий Левена работает через проверку гипотез:
- H₀ (нулевая): дисперсии групп равны (разброс одинаковый).
- H₁ (альтернативная): дисперсии различаются хотя бы у одной группы.
Дальше всё решает p-значение:
- p > 0,05 — оснований отвергать H₀ нет. Считаем дисперсии равными, условие выполнено. Это «хороший» исход: можно спокойно идти к Стьюденту или ANOVA.
- p < 0,05 — H₀ отвергаем. Дисперсии не равны, разброс в группах разный. Нужна поправка (см. ниже).
Здесь логика «перевёрнута» по сравнению с основным анализом. Для критерия Левена большое p-значение (> 0,05) — это то, что вам нужно: оно подтверждает, что предпосылка о равных дисперсиях соблюдена. Маленькое p — сигнал тревоги.
Пример. Сравниваете уровень стресса в контрольной и экспериментальной группах. Критерий Левена дал p = 0,42. Это больше 0,05 → дисперсии равны → используете классический t-критерий Стьюдента без поправок.
Что делать, если дисперсии не равны
Получили p < 0,05 — это не тупик, а просто развилка. Вариантов три.
- Поправка Уэлча. Самый частый и удобный путь для двух групп — t-критерий Стьюдента в модификации Уэлча (Welch's t-test). Он сравнивает те же средние, но корректно учитывает разный разброс. Для нескольких групп есть аналог — ANOVA Уэлча.
- Непараметрический критерий. Если данные ещё и ненормальны, переходите к ранговым методам, которым равенство дисперсий не нужно: критерий Манна-Уитни для двух групп и Краскела-Уоллиса для трёх и более. Подробнее о разнице — в статье «Параметрические и непараметрические критерии».
- Преобразование данных. Иногда логарифмирование «уравнивает» разброс, но для студенческой работы это перебор — проще взять Уэлча или непараметрику.
Не игнорируйте «плохой» результат Левена и не считайте классический Стьюдента «как будто всё в порядке». Если разброс групп разный, а вы взяли формулу для равных дисперсий, p-значение основного теста окажется недостоверным — и вывод диплома можно будет оспорить на защите.
Пример с расчётом
Покажем на сквозном примере, как Левен встраивается в анализ.
Пример. В дипломе по физкультуре сравнивают результат прыжка в длину с места в двух группах студентов: обычная программа (n = 15) и экспериментальная (n = 15). Сначала проверяют равенство дисперсий, потом — различие средних t-критерием.
Результат проверки удобно свести в таблицу (на неё в тексте ссылаются: «результаты проверки предпосылок приведены в таблице 1»).
Таблица 1 — Проверка равенства дисперсий по критерию Левена (n = 15 + 15)
| Показатель | Дисперсия, гр. 1 | Дисперсия, гр. 2 | Статистика Левена (F) | p | Вывод |
|---|---|---|---|---|---|
| Прыжок в длину, см | 64 | 71 | 0,18 | 0,67 | дисперсии равны (p > 0,05) |
Вывод словами: «Дисперсии результатов в двух группах статистически не различаются (критерий Левена: F = 0,18; p = 0,67 > 0,05), поэтому для сравнения средних применён t-критерий Стьюдента для независимых выборок».
На рисунке 1 видно, почему результат именно такой: разброс (высота «облака» точек) в группах примерно одинаков, и критерий Левена это подтверждает.
Если бы точки одной группы «облаком» растянулись по всей высоте, а другой — собрались в узкую полоску, критерий Левена выдал бы p < 0,05, и мы перешли бы к поправке Уэлча.
Что писать в дипломе
Готовые формулировки под оба исхода — можно вставлять почти дословно, подставив свои числа.
Когда дисперсии равны (p > 0,05):
- «Проверка равенства дисперсий по критерию Левена показала отсутствие значимых различий (F = 0,18; p = 0,67), что позволяет применить t-критерий Стьюдента для независимых выборок».
Когда дисперсии не равны (p < 0,05):
- «По критерию Левена дисперсии групп статистически различаются (F = 6,4; p = 0,02), поэтому применён t-критерий Стьюдента с поправкой Уэлча».
- «В связи с нарушением условия равенства дисперсий (критерий Левена: p < 0,05) для сравнения групп использован непараметрический критерий Манна-Уитни».
Минимум, который ждут от вас в тексте: название критерия (Левена), его статистику (F), p-значение и вывод-следствие — какой критерий сравнения средних вы из-за этого выбрали. Без этой связки проверка выглядит «висящей в воздухе».
Частые ошибки
- Путать с нормальностью. Критерий Левена проверяет разброс между группами, а не форму распределения. Нормальность проверяют отдельно — Шапиро-Уилком или Колмогорова-Смирнова.
- Читать p «наоборот». Здесь p > 0,05 — это хорошо (дисперсии равны). Студенты по привычке радуются маленькому p, а для Левена это как раз проблема.
- Игнорировать «плохой» результат. Получили p < 0,05 и всё равно взяли классического Стьюдента — вывод становится недостоверным. Нужна поправка Уэлча или непараметрика.
- Применять Левена к связанным выборкам. Для замеров «до/после» у одних и тех же людей дисперсии групп не сравнивают — там работают парный Стьюдент или Вилкоксон.
- Забывать про вывод-следствие. Сама по себе строчка «p = 0,67» ничего не объясняет: нужно дописать, какой критерий вы из-за неё выбрали.
Частые вопросы
Что значит «гомогенность дисперсий»?
Это и есть равенство дисперсий — одинаковый разброс данных в группах. «Гомогенность», «гомоскедастичность» и «равенство дисперсий» в студенческой работе можно считать синонимами.
p получилось больше 0,05 — это хорошо или плохо?
Для критерия Левена это хорошо: дисперсии равны, условие для t-критерия и ANOVA выполнено. Можно спокойно считать основной критерий по классической формуле.
Чем критерий Левена отличается от критерия Фишера (F-теста)?
Оба проверяют равенство дисперсий, но F-тест Фишера очень чувствителен к ненормальности данных и работает только для двух групп. Критерий Левена устойчивее к отклонениям от нормальности и годится для любого числа групп — поэтому в дипломах чаще берут именно его. Не путайте с угловым преобразованием Фишера — это совсем про другое (сравнение долей).
Нужен ли критерий Левена, если я считаю непараметрику?
Нет. Манна-Уитни, Краскела-Уоллиса и другим ранговым методам равенство дисперсий не требуется — они изначально не опираются на это условие.
А если у меня три и больше групп?
Критерий Левена работает и для трёх, и для пяти групп — это его плюс перед F-тестом Фишера. Если дисперсии равны, считаете ANOVA; если нет — ANOVA Уэлча или Краскела-Уоллиса.
Короткий алгоритм
- Проверьте нормальность в каждой группе (Шапиро-Уилк).
- Запустите критерий Левена и посмотрите p-значение.
- p > 0,05 → дисперсии равны → классический t-критерий Стьюдента или ANOVA.
- p < 0,05 → дисперсии не равны → поправка Уэлча или непараметрика (Манна-Уитни / Краскела-Уоллиса).
- В тексте укажите F, p и какой критерий сравнения средних вы из-за этого выбрали.
Что ещё почитать
- Как проверить нормальность распределения — второе обязательное условие перед параметрикой.
- Параметрические и непараметрические критерии — куда уходить, если условия не выполнены.
- Руководство по дисперсионному анализу ANOVA — где Левен встречается чаще всего.
- Стандартное отклонение и дисперсия — что вообще такое «разброс».
- Калькулятор t-критерия Стьюдента и калькулятор ANOVA — посчитать онлайн.
Не уверены, выполнены ли условия и какой критерий брать, — загляните в базу методов или закажите консультацию: эксперт проверит предпосылки и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию