Q-критерий Кохрена: несколько связанных долей
Когда и как применять Q-критерий Кохрена для трёх и более замеров «справился/не справился» у одних людей. Расчёт, готовые формулировки для диплома, с примерами и FAQ.
Вы проверяли одних и тех же людей не два раза, а три или больше — и каждый раз фиксировали только «да/нет»: справился с заданием или нет, сдал норматив или нет, проявился симптом или нет. Нужно доказать, что доля «успехов» по этапам меняется не случайно.
Для этой ситуации есть специальный инструмент — Q-критерий Кохрена. Разберём, когда он нужен, как считается и что писать в дипломе.
В двух словах
Q-критерий Кохрена проверяет, одинакова ли доля «успехов» в трёх и более связанных замерах бинарного (да/нет) признака у одних и тех же испытуемых.
- Это обобщение критерия Макнемара (тот сравнивает только два замера «да/нет») на три и больше точек.
- По логике это «брат» критерия Фридмана, только Фридман — для баллов и рангов, а Кохрен — строго для ответов «0 или 1».
- Отдельного калькулятора Кохрена у нас пока нет, но расчёт элементарный (формула ниже), а для родственных задач используйте критерий Фридмана и хи-квадрат.
«Связанные» замеры — это когда измеряют одних и тех же людей в разные моменты (или у каждого человека несколько условий). Если же на каждом этапе участвуют разные люди, Кохрен не подходит — это случай для хи-квадрат.
Когда применять Q-критерий Кохрена
Все условия должны выполняться вместе:
- Признак бинарный — ровно два исхода, которые кодируются как 1 («успех», «есть») и 0 («неудача», «нет»).
- Три и больше замеров одного и того же признака. Для двух замеров берут критерий Макнемара — частный случай Кохрена.
- Замеры связаны — это одни и те же испытуемые на каждом этапе (или каждый прошёл все условия).
- Полные данные — у каждого человека есть результат во всех замерах (пропуски обычно удаляют целиком по человеку).
Пример. 30 школьников выполняли упражнение на координацию трижды за семестр: в сентябре, ноябре и декабре. Каждый раз — «выполнил норматив» (1) или «не выполнил» (0). Один и тот же бинарный признак, три связанных замера → Q-критерий Кохрена.
Типичные задачи, где он встречается: динамика навыка по этапам тренировки, доля правильных ответов теста до/в процессе/после обучения, наличие симптома на нескольких визитах, успешность функциональной пробы при разных нагрузках.
Что именно проверяет критерий
Гипотезы формулируются так (подробнее — в статье про нулевую и альтернативную гипотезы):
- H₀ — доля «успехов» одинакова во всех замерах (различия случайны).
- H₁ — хотя бы в одном замере доля «успехов» отличается.
Если получили значимый результат (p < 0,05), вы отклоняете H₀ и говорите: доля справившихся по этапам меняется не случайно.
Кохрен отвечает только на вопрос «есть ли различия хоть где-то между замерами». Он не говорит, какие именно пары этапов отличаются. Чтобы это узнать, нужны попарные сравнения (см. раздел «Что после Кохрена»).
Как считается: формула и пример
Соберите данные в таблицу: строки — испытуемые, столбцы — замеры, в клетках только 0 или 1. Понадобятся три набора сумм.
- k — число замеров (столбцов).
- Gⱼ — сумма единиц в каждом столбце (сколько «успехов» на данном этапе).
- Lᵢ — сумма единиц в каждой строке (сколько раз данный человек был успешен).
- N — общая сумма всех единиц в таблице.
Формула Q-критерия Кохрена:
Q = k·(k − 1)·[ Σ Gⱼ² − N²/k ] / [ k·N − Σ Lᵢ² ]
Простыми словами: в числителе — насколько «разъезжаются» суммы по столбцам (этапам), в знаменателе — поправка на то, что разные люди в целом успешны по-разному. Чем сильнее доли по этапам отличаются друг от друга, тем больше Q.
Готовое значение Q сравнивают с критическим по таблице хи-квадрат при числе степеней свободы df = k − 1. Если Q больше критического (или p < 0,05) — различия значимы.
Покажем на маленьком примере. Пусть 8 спортсменов выполняли пробу на трёх этапах; в таблице 1 — кто справился (1), кто нет (0).
Таблица 1 — Результаты пробы «справился/не справился» у 8 спортсменов на трёх этапах
| Спортсмен | Этап 1 | Этап 2 | Этап 3 | Lᵢ (сумма по строке) |
|---|---|---|---|---|
| 1 | 0 | 1 | 1 | 2 |
| 2 | 0 | 0 | 1 | 1 |
| 3 | 1 | 1 | 1 | 3 |
| 4 | 0 | 1 | 1 | 2 |
| 5 | 0 | 0 | 1 | 1 |
| 6 | 0 | 1 | 1 | 2 |
| 7 | 1 | 1 | 1 | 3 |
| 8 | 0 | 0 | 1 | 1 |
| Gⱼ (сумма по столбцу) | 2 | 5 | 8 | N = 15 |
Подставляем: k = 3; Σ Gⱼ² = 2² + 5² + 8² = 4 + 25 + 64 = 93; N = 15; Σ Lᵢ² = 2² + 1² + 3² + 2² + 1² + 2² + 3² + 1² = 4+1+9+4+1+4+9+1 = 33.
- Числитель: 3·2·(93 − 15²/3) = 6·(93 − 75) = 6·18 = 108.
- Знаменатель: 3·15 − 33 = 45 − 33 = 12.
- Q = 108 / 12 = 9,0.
Степеней свободы df = k − 1 = 2. Критическое значение хи-квадрат при df = 2 и p = 0,05 равно 5,99. Наше Q = 9,0 > 5,99 → различия значимы, доля справившихся по этапам растёт не случайно (p < 0,05).
На рисунке 1 хорошо видно, почему критерий «сработал»: доля успехов поднимается от этапа к этапу.
Считать вручную нужно редко: соберите таблицу из 0 и 1 в Excel, посчитайте суммы по столбцам и строкам функцией СУММ — и подставьте в формулу. А проверить расчёт и оформить отчёт поможет онлайн-SPSS.
Что после Кохрена: попарные сравнения
Значимый Q говорит лишь, что различия где-то есть. Чтобы понять, между какими этапами, сравнивают замеры попарно — для двух связанных «да/нет» замеров это критерий Макнемара.
Но есть ловушка: чем больше пар вы проверяете, тем выше шанс случайно «найти» различие. Поэтому уровень значимости ужесточают — например, поправкой Бонферрони (делят 0,05 на число сравнений). Подробно — в статье про множественные сравнения и поправку Бонферрони.
Пример. Q значим, этапов три → три пары (1–2, 2–3, 1–3). С поправкой Бонферрони считаем различие значимым, если p < 0,05 / 3 ≈ 0,017, а не привычные 0,05.
Что писать в дипломе
В тексте обязательно укажите критерий, значение Q, число степеней свободы и p-значение (что это такое — в статье «Что такое p-значение»):
- p < 0,05 — доля «успехов» по этапам меняется статистически значимо;
- p > 0,05 — значимых изменений нет.
Готовые формулировки:
- «Доля спортсменов, справившихся с пробой, статистически значимо различается между тремя этапами (Q = 9,0; df = 2; p < 0,05)».
- «Статистически значимых изменений доли успешных ответов по трём замерам не выявлено (Q = 1,8; df = 2; p = 0,41)».
К выводу полезно приложить сами доли (или проценты) «успехов» на каждом этапе — так читатель сразу видит направление динамики. Как корректно подать числа, описано в статье «Как описать результаты статистики».
Минимум для диплома: фраза с Q, df и p, таблица с долями по этапам и одно предложение-вывод словами — что доля справившихся выросла (или не изменилась) значимо.
Частые ошибки
- Применять к баллам, а не к «да/нет». Кохрен только для бинарного признака. Если у вас баллы анкеты или нормативы в секундах — это критерий Фридмана.
- Считать Кохрен для двух замеров. Для двух связанных «да/нет» замеров берут критерий Макнемара (Кохрен — его обобщение на 3+).
- Путать связанные и независимые группы. Если на этапах разные люди, Кохрен неприменим — нужен хи-квадрат.
- Останавливаться на значимом Q. Сам Q не показывает, какие пары этапов отличаются — нужны попарные сравнения с поправкой.
- Кодировать признак как 1 и 2 вместо 0 и 1. Формула рассчитана на коды 0/1; другая кодировка ломает расчёт.
Частые вопросы
Чем Кохрен отличается от критерия Фридмана?
Оба — для трёх и более связанных замеров. Но Фридман работает с баллами и рангами (например, уровень тревожности в баллах), а Кохрен — строго с бинарным «да/нет». Фактически Кохрен — это частный случай для дихотомических данных.
Сколько человек нужно для Q-критерия Кохрена?
Жёсткого минимума нет, но при маленькой выборке (меньше ~15–20 человек) приближение к хи-квадрат становится грубым. Практический ориентир — хотя бы 4·k наблюдений, то есть от 12 человек при трёх замерах. О численности в целом — статья «Сколько респондентов нужно для диплома».
Что делать со «строками-константами»?
Если человек на всех этапах показал один и тот же результат (всё 0 или всё 1), он не вносит информации о различиях между этапами. На итог это влияет слабо, удалять такие строки специально не нужно — формула учитывает их корректно.
А если у некоторых людей есть пропуски?
Кохрен требует полных данных. Обычно человека с пропуском в любом замере удаляют целиком, а итоговый объём выборки указывают по оставшимся.
Какой шкалы должен быть признак?
Номинальной дихотомической: два взаимоисключающих исхода. Если интересно, какие бывают шкалы измерения, посмотрите статью «Шкалы измерения».
Короткий алгоритм
- Признак бинарный (да/нет)? Если нет (баллы, ранги) → критерий Фридмана.
- Замеров три и больше и это одни и те же люди? → Q-критерий Кохрена. Для двух замеров → критерий Макнемара.
- Посчитайте суммы по столбцам (Gⱼ) и строкам (Lᵢ), подставьте в формулу, найдите Q.
- Сравните Q с хи-квадрат при df = k − 1. Q больше критического (p < 0,05) → различия значимы.
- Если значимо — сделайте попарные сравнения с поправкой Бонферрони.
Что ещё почитать
- Руководство по критерию Фридмана — «старший брат» для баллов и рангов на 3+ замера.
- Руководство по критерию хи-квадрат — когда группы независимы, а не связаны.
- Множественные сравнения и поправка Бонферрони — что делать после значимого результата.
- Как выбрать статистический критерий для диплома — общая схема выбора метода.
- Калькулятор критерия Фридмана и калькулятор хи-квадрат — посчитать смежные задачи онлайн.
Не уверены, какой критерий подходит вашим данным, — загляните в базу методов или закажите консультацию: эксперт подберёт метод и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию