Хи-квадрат или критерий Фишера (φ*): что выбрать
Когда сравнивать частоты по таблице сопряжённости критерием хи-квадрат, а когда сравнивать две доли угловым преобразованием Фишера. С примером, таблицей, схемой выбора и FAQ.
Вы работаете не с числами вроде роста или баллов, а с частотами: сколько человек справились, а сколько нет; кто выбрал вариант А, кто Б. И хотите доказать, что различие между группами не случайно.
Здесь спорят два метода — критерий хи-квадрат (χ²) Пирсона и угловое преобразование Фишера (φ)*. Оба про качественные данные, но решают разные задачи. Разберём, как не перепутать.
В двух словах
- Критерий хи-квадрат (χ²) анализирует таблицу сопряжённости — связь или различие в распределении частот сразу по нескольким категориям и группам. Универсален, но требует достаточных частот в ячейках.
- Угловое преобразование Фишера (φ*) сравнивает две группы по доле объектов с признаком «есть эффект / нет эффекта». Заточен под проценты и хорошо работает на малых выборках.
Простое правило: сравниваете две доли по признаку «да/нет» — берите φ*; разбираете таблицу с несколькими категориями или связь двух признаков — берите χ². Оба — не для средних и числовых измерений (для них смотрите как выбрать критерий).
Когда брать хи-квадрат (χ²)
Берите χ², если верно хотя бы одно:
- У вас таблица сопряжённости r×c — строки и столбцы с несколькими категориями (например, 3 уровня мотивации × 2 группы).
- Вы проверяете связь двух номинальных признаков (пол × предпочтение, тип темперамента × выбор профессии).
- Категорий больше двух хотя бы по одному признаку — φ* здесь уже не подходит.
Пример. Вы сравниваете распределение студентов по трём уровням тревожности (низкий / средний / высокий) в контрольной и экспериментальной группах. Это таблица 3×2 → хи-квадрат.
У χ² есть жёсткое требование: ожидаемая частота в каждой ячейке ≥ 5. Если в таблице есть ячейки с ожидаемой частотой меньше 5 (частая беда на малых выборках), результат χ² ненадёжен — нужны поправка Йейтса или точный критерий Фишера.
Когда брать φ* Фишера
Берите угловое преобразование Фишера, если выполняется всё:
- сравниваете ровно две группы;
- признак дихотомический — «эффект есть / эффекта нет», «справился / не справился», «да / нет»;
- вас интересует именно доля (процент) объектов с признаком в каждой группе;
- выборка небольшая — φ* устойчиво работает там, где χ² уже «сыплется» из-за малых частот.
Пример. В экспериментальной группе задание выполнили 12 из 20 (60%), в контрольной — 5 из 18 (28%). Вопрос: значимо ли доля справившихся выше? Две группы, признак «справился/нет», проценты → φ* Фишера.
φ* отлично подходит для дипломных выборок в 15–30 человек на группу, где χ² часто упирается в малые ожидаемые частоты. Если данные сводятся к «процент в группе 1 против процента в группе 2» — это почти всегда задача для Фишера.
Чем отличаются по сути
- Хи-квадрат сравнивает наблюдаемые частоты с ожидаемыми (теми, что были бы при отсутствии связи) и суммирует расхождения по всем ячейкам таблицы. Чем сильнее реальность отличается от «случайного» распределения, тем больше χ². Метод видит картину целиком, по всем категориям сразу.
- Угловое преобразование Фишера переводит доли в углы (то самое «угловое преобразование» φ), а затем смотрит, насколько далеко разошлись два угла с учётом размеров групп. Он отвечает на один точный вопрос: доля в одной группе достоверно больше, чем в другой?
Простая логика: χ² разбирает всю таблицу частот, φ* сравнивает два процента.
Ключевое различие — в задаче, а не в типе данных. И χ², и φ* работают с частотами качественных признаков. Но χ² отвечает «есть ли связь / различие в распределении», а φ* — «больше ли доля в группе А, чем в группе Б».
Что писать в дипломе
После расчёта сравнивают эмпирическое значение критерия с критическим:
- для χ²: если χ²_эмп ≥ χ²_крит — различие значимо;
- для φ*: если φ*_эмп ≥ φ*_крит (для p ≤ 0,05 это 1,64) — различие долей значимо.
Примеры формулировок:
- «Распределение уровней тревожности в группах различается статистически значимо (χ² = 9,8 при χ²_крит = 5,99; p < 0,05)».
- «Доля справившихся в экспериментальной группе значимо выше, чем в контрольной (φ* = 2,01 > 1,64; p < 0,05)».
- «Статистически значимых различий не выявлено (φ* = 1,12; p > 0,05)».
Обязательно укажите сам критерий, его эмпирическое значение, критическое значение (или число степеней свободы для χ²) и p-значение. Для долей хорошо привести и сами проценты по группам — это делает вывод наглядным.
Как оформить таблицу
На таблицу в тексте ссылаются прямо: «Результаты сравнения долей представлены в таблице 1». Подпись таблицы ставят сверху.
Таблица 1 — Доля справившихся с заданием в двух группах (критерий φ* Фишера)
| Группа | Справились | Не справились | Доля справившихся | φ* эмп | φ* крит (p ≤ 0,05) | Вывод |
|---|---|---|---|---|---|---|
| Экспериментальная (n = 20) | 12 | 8 | 60% | 2,01 | 1,64 | различие значимо (p < 0,05) |
| Контрольная (n = 18) | 5 | 13 | 28% | — | — | — |
После таблицы — короткий вывод словами: «Доля справившихся в экспериментальной группе (60%) значимо выше, чем в контрольной (28%): φ* = 2,01 > φ*₍₀,₀₅₎ = 1,64; p < 0,05».
Сравнение методов
Чтобы окончательно развести два критерия, удобно держать перед глазами их различия (таблица 2).
Таблица 2 — Хи-квадрат и угловое преобразование Фишера: что отличается
| Параметр | Хи-квадрат (χ²) | Угловое преобразование Фишера (φ*) |
|---|---|---|
| Что сравнивает | распределение частот по таблице | две доли (процента) |
| Число групп | две и больше | ровно две |
| Число категорий признака | две и больше | строго две («да/нет») |
| Тип задачи | связь / различие распределений | «доля А > доли Б?» |
| Малые выборки | плохо при ожидаемых частотах < 5 | работает хорошо |
| Правило значимости | χ²_эмп ≥ χ²_крит | φ*_эмп ≥ 1,64 (p ≤ 0,05) |
Если данные сводятся к одной таблице 2×2 «две группы × да/нет» — подойдут оба, и тогда выбирают по удобству (об этом ниже).
Частые ошибки
- Брать χ² при ожидаемых частотах меньше 5. На малых выборках результат искажается — нужны поправка Йейтса или точный критерий Фишера.
- Считать φ* там, где категорий больше двух. φ* сравнивает только две доли по дихотомическому признаку; для трёх и более категорий — χ².
- Применять χ² или φ* к средним и числовым данным. Это критерии для частот качественных признаков, а не для роста, баллов или времени.
- Сравнивать сами числа справившихся, а не доли. При разном размере групп «12 против 5» ни о чём не говорит — сравнивать нужно проценты (60% против 28%).
- Путать угловое преобразование Фишера и точный критерий Фишера. Это разные вещи: φ* сравнивает доли, а точный критерий Фишера спасает таблицу 2×2 при очень малых частотах.
Частые вопросы
Чем угловое преобразование Фишера отличается от точного критерия Фишера?
Это два разных метода с похожим названием. Угловое преобразование (φ*) сравнивает две доли через перевод процентов в углы. Точный критерий Фишера — отдельный метод для таблиц 2×2, который применяют, когда у χ² ожидаемые частоты слишком малы (< 5).
Что делать, если в таблице 2×2 очень маленькие частоты?
Не использовать обычный χ². Берите точный критерий Фишера или χ² с поправкой Йейтса. Если задача — именно сравнить две доли, удобно сразу взять угловое преобразование Фишера: оно корректно на малых выборках.
Можно ли заменить χ² на φ* для таблицы 2×2?
Да, если у вас именно «две группы × да/нет». Тогда оба критерия отвечают на один вопрос, и можно взять любой — φ* часто удобнее на маленьких выборках. А вот при трёх и более категориях замена невозможна — нужен только χ².
Откуда берётся критическое значение 1,64 для φ*?
Это критическое значение углового преобразования для уровня значимости p ≤ 0,05. Для более строгого p ≤ 0,01 порог выше — 2,31. Если φ*_эмп превышает порог, различие долей считается значимым.
Хи-квадрат и φ* — параметрические критерии?
Нет, оба относятся к непараметрическим — они не требуют нормального распределения и работают с частотами. Подробнее о разнице — в статье «Параметрические и непараметрические критерии».
Сколько человек нужно для этих критериев?
φ* работает даже на совсем небольших выборках (от нескольких наблюдений в группе), что и делает его удобным для дипломов. Для χ² важно не столько общее число, сколько чтобы ожидаемая частота в каждой ячейке была ≥ 5.
Короткий алгоритм
- Данные — частоты качественного признака? Если нет (числа, баллы, средние) — вам нужны другие критерии.
- Сравниваете две группы по одной доле «да/нет»? → φ* Фишера.
- Несколько категорий или связь двух признаков (таблица r×c)? → хи-квадрат.
- В таблице 2×2 очень малые частоты (ожидаемые < 5)? → точный критерий Фишера или поправка Йейтса.
Короче: две доли «да/нет» → φ* Фишера; таблица с несколькими категориями или связь признаков → хи-квадрат; очень малые частоты в 2×2 → точный критерий Фишера.
Что ещё почитать
- Руководство по критерию хи-квадрат — как считать и читать таблицу сопряжённости.
- Руководство по угловому преобразованию Фишера — пошаговый расчёт φ*.
- Как выбрать статистический критерий для диплома — общая схема выбора.
- Параметрические и непараметрические критерии — в чём принципиальная разница.
- Калькулятор хи-квадрат и калькулятор φ* Фишера — посчитать онлайн.
Не уверены в выборе — посмотрите базу методов или закажите консультацию: эксперт подберёт критерий и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию