Двухфакторный дисперсионный анализ (two-way ANOVA)
Как два фактора влияют на результат сразу: главные эффекты и взаимодействие на примере пол×программа. Когда нужен, как читать таблицу ANOVA, с примерами и FAQ.
Иногда в дипломе на результат влияет не один фактор, а сразу два. Например, и программа тренировок, и пол спортсмена. Хочется проверить оба сразу — и заодно понять, не работает ли программа по-разному у мужчин и женщин.
Именно для этого нужен двухфакторный дисперсионный анализ. Он проверяет влияние каждого фактора по отдельности и их совместный эффект — одним расчётом.
В двух словах
- Двухфакторный дисперсионный анализ (two-way ANOVA) проверяет влияние двух факторов на один числовой показатель и их взаимодействие.
- Он даёт сразу три ответа: влияет ли фактор A, влияет ли фактор B и зависит ли эффект одного фактора от другого.
- Берут его, когда в дизайне исследования заложены два независимых фактора (пол, возраст, группа, метод) и числовой результат.
Это «старший брат» обычного однофакторного ANOVA: там фактор один, здесь — два.
Что такое фактор и уровни простыми словами
Фактор — это то, что мы меняем или по чему делим людей на группы. Уровни — конкретные варианты этого фактора.
Звучит сухо, поэтому сразу на примере.
Пример. Фактор «программа тренировок» имеет два уровня: обычная и интервальная. Фактор «пол» тоже два уровня: мужчины и женщины. Результат — прирост выносливости в баллах.
В двухфакторном анализе мы разбиваем всех участников на ячейки по сочетанию уровней. В примере выше ячеек четыре: мужчины-обычная, мужчины-интервальная, женщины-обычная, женщины-интервальная. В каждой ячейке — своя группа людей.
Факторы могут иметь и больше двух уровней. Например, «программа» из трёх вариантов и «возраст» из трёх категорий дадут уже 3 × 3 = 9 ячеек. Логика та же, просто таблица крупнее.
Главные эффекты и взаимодействие
Это сердце метода. Двухфакторный ANOVA отвечает на три вопроса сразу.
- Главный эффект фактора A. Влияет ли программа на результат, если усреднить по полу? То есть в среднем по всем участникам интервальная программа лучше обычной или нет.
- Главный эффект фактора B. Влияет ли пол на результат, если усреднить по программам? В среднем мужчины и женщины показывают разный прирост или одинаковый.
- Взаимодействие A × B. Зависит ли эффект программы от пола? Может, интервальная программа сильно помогает мужчинам, а женщинам — почти нет.
Главный эффект — это влияние фактора «в целом», в отрыве от второго фактора. Взаимодействие — это когда два фактора работают не по отдельности, а вместе, усиливая или гася друг друга.
Пример. Кофе бодрит, и спорт бодрит. Но кофе перед сном + тревога могут дать совсем не сумму эффектов, а резкий скачок бессонницы. Вот это «не просто сумма» и есть взаимодействие.
Взаимодействие — главная причина брать именно двухфакторный анализ. Если эффект одного фактора разный на разных уровнях другого, то говорить про «средний эффект программы» уже некорректно — нужно описывать его отдельно для мужчин и для женщин.
Когда нужен двухфакторный ANOVA
Берите его, когда одновременно верно:
- Два независимых фактора. Например, метод обучения и курс; тип питания и пол; программа и квалификация.
- Результат — числовой. Баллы теста, время, прирост показателя, рост, давление.
- Вам интересно взаимодействие или вы хотите проверить оба фактора экономно, одним анализом.
- В каждой ячейке есть наблюдения — желательно примерно поровну (это упрощает расчёт и трактовку).
Если фактор всего один (просто три группы) — нужен однофакторный ANOVA. А чтобы понять, сколько у вас вообще факторов и групп, загляните в статью «U, H или ANOVA — сколько групп».
Условия применения
Допущения те же, что и у обычного ANOVA, — это параметрический метод.
- Числовые данные. Не баллы порядковой анкеты в чистом виде, а измерения или шкальные суммы.
- Нормальность. Распределение внутри ячеек (точнее, остатков) близко к нормальному — проверяют критерием Шапиро-Уилка. Как это делать — в статье «Как проверить нормальность распределения».
- Равенство дисперсий. Разброс в ячейках примерно одинаков (тест Левена).
- Независимость. В каждой ячейке — разные люди, наблюдения не связаны между собой.
Двухфакторный ANOVA — для независимых групп: в каждой ячейке свои участники. Если вы измеряете одних и тех же людей в нескольких условиях (повторные замеры), нужен другой, более сложный дизайн — обсудите его с научным руководителем, а в спорной ситуации загляните в базу методов.
Как читать таблицу двухфакторного ANOVA
Главное отличие от однофакторного: в таблице не одна строка-фактор, а три содержательные строки — фактор A, фактор B и взаимодействие A × B. Плюс строка ошибки (внутригрупповая изменчивость) и общая.
Для каждой строки фактора считают своё значение F и своё p. Читать просто: смотрите на p в каждой строке.
- p < 0,05 в строке фактора → этот фактор влияет на результат.
- p < 0,05 в строке взаимодействия → эффект одного фактора зависит от уровня другого.
- p > 0,05 → влияния (или взаимодействия) нет, различия случайны.
Идея F та же, что в руководстве по ANOVA: это отношение «полезной» изменчивости (от фактора) к «шуму» внутри ячеек. Чем больше F, тем вероятнее, что эффект реален. Подробнее про сам показатель — в статье «Что такое p-значение».
Разбор примера с таблицей
Возьмём наш сюжет: пол (мужчины / женщины) × программа (обычная / интервальная), результат — прирост выносливости в баллах. В каждой из четырёх ячеек по 10 человек, всего N = 40.
Сначала средние по ячейкам и краям таблицы.
Таблица 1 — Средний прирост выносливости по ячейкам (баллы, по 10 человек в ячейке)
| Программа | Мужчины | Женщины | В среднем по программе |
|---|---|---|---|
| Обычная | 6,0 | 5,5 | 5,75 |
| Интервальная | 12,0 | 6,5 | 9,25 |
| В среднем по полу | 9,0 | 6,0 | 7,5 |
Уже из краёв таблицы видна картина: интервальная программа в среднем сильнее (9,25 против 5,75), мужчины в среднем прибавляют больше (9,0 против 6,0). Но обратите внимание: у мужчин интервальная программа дала рывок (6 → 12), а у женщин — почти нет (5,5 → 6,5). Это и есть подозрение на взаимодействие.
Теперь сводная таблица ANOVA, которую выдаёт расчёт.
Таблица 2 — Таблица двухфакторного дисперсионного анализа (N = 40)
| Источник вариации | SS | df | MS | F | p |
|---|---|---|---|---|---|
| Программа (фактор A) | 122,5 | 1 | 122,5 | 24,5 | < 0,001 |
| Пол (фактор B) | 90,0 | 1 | 90,0 | 18,0 | < 0,001 |
| Взаимодействие A × B | 60,0 | 1 | 60,0 | 12,0 | 0,001 |
| Ошибка (внутри ячеек) | 180,0 | 36 | 5,0 | — | — |
| Общая | 452,5 | 39 | — | — | — |
Читаем по строкам: оба главных эффекта значимы (p < 0,001), и взаимодействие тоже значимо (p = 0,001). Степени свободы для каждого фактора здесь равны 1, потому что у каждого по два уровня (df = число уровней − 1).
Раз взаимодействие значимо, нагляднее всего показать его на графике средних.
Самый простой признак взаимодействия — на графике средних линии не параллельны (расходятся или пересекаются). Если линии идут параллельно, взаимодействия нет: фактор действует одинаково на всех уровнях второго фактора.
Что писать в дипломе
Сначала опишите каждый эффект отдельно, со своим F, степенями свободы и p. Формат: F(df_фактора; df_ошибки).
Готовые формулировки по нашему примеру:
- «Выявлен значимый главный эффект программы тренировок (F(1; 36) = 24,5; p < 0,001): интервальная программа дала больший прирост, чем обычная (9,25 против 5,75 балла)».
- «Главный эффект пола также значим (F(1; 36) = 18,0; p < 0,001): мужчины в среднем прибавили больше женщин (9,0 против 6,0 балла)».
- «Обнаружено значимое взаимодействие факторов "программа × пол" (F(1; 36) = 12,0; p = 0,001): прирост от интервальной программы у мужчин (с 6,0 до 12,0) выражен сильнее, чем у женщин (с 5,5 до 6,5)».
А если взаимодействие не значимо, пишут так: «Взаимодействие факторов не достигло уровня значимости (F(1; 36) = 0,8; p = 0,38), то есть эффект программы одинаков для мужчин и женщин».
Главное правило вывода: значимое взаимодействие важнее главных эффектов. Если оно есть, не ограничивайтесь фразой «программа влияет» — обязательно опишите, что у мужчин и женщин эффект разный, и приведите средние по ячейкам.
Частые ошибки
- Игнорировать взаимодействие. Это главная фишка метода. Если оно значимо, а вы пишете только про «средний эффект программы» — вывод вводит в заблуждение.
- Толковать главный эффект при значимом взаимодействии как универсальный. При значимом A × B фраза «программа в целом лучше» неточна: лучше она не для всех.
- Применять к баллам анкет и ненормальным данным. ANOVA параметрический; для рангов и порядковых шкал он некорректен.
- Сильно неравные ячейки. Когда в одной ячейке 3 человека, а в другой 30, расчёт усложняется, а выводы становятся шаткими.
- Путать два фактора с двумя замерами. Двухфакторный ANOVA — про два признака у независимых групп, а не про «до и после».
Частые вопросы
Чем двухфакторный ANOVA отличается от однофакторного?
Однофакторный смотрит влияние одного фактора, двухфакторный — двух сразу и плюс их взаимодействие. То есть из одного расчёта вы получаете три ответа вместо одного.
Что важнее — главные эффекты или взаимодействие?
Если взаимодействие значимо, начинайте с него: оно меняет смысл главных эффектов. Главные эффекты при этом всё равно приводят, но трактуют осторожно, отдельно по уровням.
Что значит, что взаимодействие незначимо?
Что факторы действуют независимо: эффект одного одинаков на всех уровнях другого. Тогда можно спокойно описывать главные эффекты как общие для всех.
Можно ли вместо двухфакторного сделать два однофакторных?
Можно, но вы потеряете информацию о взаимодействии и проведёте лишние тесты, накапливая ошибку. Один двухфакторный анализ и экономнее, и информативнее.
А если данные ненормальные или это баллы анкеты?
Строгого простого аналога two-way ANOVA для рангов в дипломах обычно не используют. Часто переходят к критерию Краскела-Уоллиса по объединённым группам или советуются с руководителем. Про выбор семейства методов — «Параметрические и непараметрические критерии».
Нужен ли постхок после двухфакторного ANOVA?
Если у фактора больше двух уровней и он значим, то да — попарные сравнения с поправкой уточнят, какие уровни различаются. При двух уровнях постхок не нужен: и так ясно, какая группа выше.
Короткий алгоритм
- Убедитесь, что у вас два фактора и числовой результат, а группы независимы.
- Проверьте условия: нормальность (Шапиро-Уилк) и равенство дисперсий.
- Постройте таблицу средних по ячейкам и краям — прикиньте картину заранее.
- Запустите расчёт ANOVA и получите F и p для фактора A, фактора B и взаимодействия.
- Читайте по строкам: где p < 0,05 — там эффект есть.
- Если взаимодействие значимо — опишите его в первую очередь, постройте график средних.
Если же на шаге 1 фактор оказался один — вам нужен не двухфакторный, а обычный однофакторный дисперсионный анализ. Это самая частая путаница на старте.
Что ещё почитать
- Дисперсионный анализ (ANOVA): полное руководство — база по однофакторному варианту.
- U, H или ANOVA — сколько групп — как понять, какой метод по числу групп и факторов.
- Множественные сравнения и поправка Бонферрони — постхок после значимого фактора.
- Размер эффекта (d Коэна, η²) — насколько велик найденный эффект.
- Калькулятор дисперсионного анализа — посчитать онлайн.
Не уверены, что выбрали верный метод, — загляните в базу методов или закажите консультацию: эксперт подберёт анализ под ваш дизайн и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию