Точный критерий Фишера для таблиц 2×2
Когда у хи-квадрата ожидаемые частоты меньше 5, спасает точный критерий Фишера. Объясняем суть, отличие от углового φ* и хи-квадрата, с примерами и FAQ.
У вас две группы и признак «да/нет»: справился или нет, выбрал или не выбрал, заболел или здоров. Получилась маленькая таблица 2×2 — и вы хотите доказать, что различие между группами не случайно.
Логичный выбор — хи-квадрат. Но на маленькой выборке он часто запрещён: ожидаемые частоты выходят меньше 5. В этой ситуации и выручает точный критерий Фишера.
В двух словах
- Точный критерий Фишера (Fisher exact test) проверяет связь двух признаков в таблице 2×2, когда выборка маленькая и хи-квадрат применять нельзя (ожидаемые частоты < 5).
- Он не приближает, а точно считает вероятность получить такое же или ещё более «перекошенное» распределение при условии, что связи на самом деле нет. Эта вероятность и есть p-значение.
- Не путайте с угловым преобразованием Фишера (φ*): φ* сравнивает две доли, а точный критерий разбирает всю таблицу 2×2. Названия похожи, методы разные.
Если коротко: маленькая таблица 2×2 и слишком малые частоты → точный критерий Фишера; большая таблица или нормальные частоты → хи-квадрат.
Что такое таблица 2×2
Таблица сопряжённости 2×2 — это четыре числа: два признака, у каждого по два варианта. По строкам обычно стоят группы, по столбцам — исход «есть/нет».
Пример. Вы изучаете, помогает ли тренинг сдать норматив. Экспериментальная группа прошла тренинг, контрольная — нет. Считаете, кто сдал, а кто нет. Получается четыре клетки: сдали в опытной, не сдали в опытной, сдали в контрольной, не сдали в контрольной.
Вопрос исследования всегда один: связаны ли строка и столбец? Иначе говоря — зависит ли исход «сдал/не сдал» от того, в какой вы группе.
Когда хи-квадрат нельзя
Хи-квадрат — приближённый метод. Он хорошо работает только тогда, когда в каждой клетке набирается достаточно наблюдений. Стандартное требование такое:
- ожидаемая частота в каждой из четырёх ячеек ≥ 5;
- общий объём выборки желательно от 20 человек и больше.
Важно: смотрят не на то, сколько человек вы увидели в клетке, а на ожидаемую частоту — сколько бы там оказалось, будь признаки никак не связаны. Её считает любой калькулятор хи-квадрат автоматически.
Если хотя бы в одной клетке ожидаемая частота меньше 5, обычный хи-квадрат даёт завышенную значимость — вы рискуете «найти» различие, которого нет. На дипломных выборках по 15–25 человек это происходит сплошь и рядом. Не подгоняйте данные под хи-квадрат — просто возьмите точный критерий Фишера.
Почему именно «точный»? Хи-квадрат прикидывает p-значение по гладкой кривой (распределению χ²), а на малых числах эта прикидка грубовата. Точный критерий Фишера ничего не приближает: он напрямую перебирает все возможные расклады четырёх чисел и складывает их вероятности. Поэтому его ответ корректен при любой, даже совсем крошечной выборке.
Как он работает простыми словами
Представьте, что итоги по краям таблицы (сколько всего сдали, сколько всего в каждой группе) зафиксированы. Тогда внутренние четыре числа могут сложиться лишь конечным числом способов.
Точный критерий Фишера делает три вещи:
- Перебирает все возможные таблицы с такими же итогами по краям.
- Для каждой считает вероятность именно такого расклада, если связи нет.
- Складывает вероятности вашей таблицы и всех, которые «ещё перекошеннее» в ту же сторону (а для двусторонней проверки — и в обе стороны).
Полученная сумма и есть p-значение — вероятность увидеть такое различие случайно. Если она мала (обычно < 0,05), различие считают значимым. Подробнее о смысле этого числа — в статье «Что такое p-значение».
Слово «точный» здесь означает не «более правдивый, чем другие», а «вычисленный без приближений». Метод даёт честную вероятность для ваших конкретных чисел, поэтому ему можно доверять даже там, где наблюдений всего по пять-шесть в группе.
Пример с таблицей сопряжённости
Возьмём небольшое исследование. В экспериментальной группе из 12 человек норматив сдали 9, не сдали 3. В контрольной из 11 человек сдали 4, не сдали 7. Данные сведём в таблицу 1.
Таблица 1 — Сдача норматива в двух группах (точный критерий Фишера, n = 23)
| Группа | Сдали | Не сдали | Всего | Доля сдавших |
|---|---|---|---|---|
| Экспериментальная | 9 | 3 | 12 | 75% |
| Контрольная | 4 | 7 | 11 | 36% |
| Всего | 13 | 10 | 23 | — |
Выборка маленькая, и ожидаемые частоты в части ячеек падают ниже 5 — значит, хи-квадрат брать рискованно. Считаем точный критерий Фишера и получаем, к примеру, p = 0,099 (двусторонний). Это больше 0,05.
Вывод словами: «Несмотря на видимую разницу в долях (75% против 36%), различие между группами статистически не значимо (точный критерий Фишера, p = 0,099). Возможная причина — малый объём выборки». На таблицу в тексте ссылаются прямо: «Результаты представлены в таблице 1».
Этот пример показывает важную вещь: разница в процентах может выглядеть внушительно (75% и 36%), но на маленькой выборке её легко получить и случайно. Поэтому вывод всегда делают по p-значению, а не «на глаз» по самим долям.
Чтобы было нагляднее, доли сдавших удобно показать столбиками (рисунок 1).
Чем отличается от хи-квадрата
Оба метода работают с одной и той же таблицей частот и отвечают на один вопрос — «связаны ли признаки?». Разница в том, как они считают вероятность и когда их применять (таблица 2).
Таблица 2 — Точный критерий Фишера и хи-квадрат: в чём разница
| Параметр | Хи-квадрат (χ²) | Точный критерий Фишера |
|---|---|---|
| Размер таблицы | любая r×c | в первую очередь 2×2 |
| Как считает p | приближённо (по кривой χ²) | точно, перебором раскладов |
| Малые частоты (< 5) | результат ненадёжен | работает корректно |
| Объём выборки | желательно большой | подходит для маленького |
| Что на выходе | χ²_эмп и p-значение | сразу p-значение |
Простая логика: на больших выборках это почти одно и то же, а на маленьких хи-квадрат «врёт», и нужен Фишер. Поэтому многие программы при малых частотах сами предлагают перейти на точный критерий. Общий обзор χ² есть в руководстве по критерию хи-квадрат.
Чем отличается от углового Фишера (φ*)
Это разные методы, у которых совпала только фамилия в названии — их постоянно путают.
- Точный критерий Фишера. Разбирает всю таблицу 2×2 целиком и сразу выдаёт p-значение. Главное применение — спасти анализ, когда у хи-квадрата частоты слишком малы.
- Угловое преобразование Фишера (φ*). Переводит две доли в углы и сравнивает их. Отвечает на вопрос «доля в группе А больше, чем в группе Б?» и тоже хорош на малых выборках.
Если ваша задача укладывается в таблицу «две группы × да/нет», подойдёт любой из двух — и точный критерий Фишера, и φ*. Они дадут близкий вывод. Берите тот, что есть под рукой в калькуляторе φ*, и не забудьте в дипломе назвать метод полностью, чтобы не возникло путаницы. Подробное сравнение φ* и хи-квадрата — в статье «Хи-квадрат или критерий Фишера (φ*)».
Что писать в дипломе
У точного критерия Фишера нет «эмпирического значения», которое сравнивают с табличным, — главный и единственный результат это p-значение:
- p < 0,05 — связь признаков (различие между группами) статистически значима;
- p ≥ 0,05 — значимых различий не выявлено.
Готовые формулировки:
- «Различие в доле сдавших норматив между группами статистически значимо (точный критерий Фишера, p = 0,03)».
- «Статистически значимых различий между группами не выявлено (точный критерий Фишера, p = 0,099)».
- «Связь между прохождением тренинга и сдачей норматива не достигла уровня значимости (точный критерий Фишера, двусторонний, p = 0,12)».
Рядом обязательно приводят сами частоты или проценты по группам — иначе читатель не поймёт, о каком различии речь. Минимальный набор для текста такой: название метода («точный критерий Фишера»), при необходимости пометка «двусторонний», p-значение и проценты по группам — этого достаточно, чтобы вывод считался доказанным. О том, как грамотно подать цифры, читайте в статье «Как описать результаты статистики».
Частые ошибки
- Брать хи-квадрат при малых ожидаемых частотах. Если хоть в одной клетке ожидаемая частота < 5, хи-квадрат ненадёжен — нужен точный критерий Фишера.
- Путать точный критерий и угловой φ*. Это два разных метода. Точный критерий разбирает таблицу 2×2, φ* сравнивает две доли.
- Сравнивать «голые» числа вместо долей. При разном размере групп «9 против 4» само по себе ни о чём не говорит — смотрят проценты (75% против 36%).
- Делать вывод «стало лучше» по одним процентам. Без p-значения видимая разница долей не доказывает значимости — особенно на маленькой выборке.
- Применять метод к числовым данным. Точный критерий Фишера — для частот качественных признаков, а не для роста, баллов или времени. Для них смотрите, как выбрать критерий.
Частые вопросы
Чем точный критерий Фишера отличается от углового преобразования Фишера?
Это разные методы. Точный критерий анализирует всю таблицу 2×2 и сразу выдаёт p-значение, его главная роль — заменить хи-квадрат при малых частотах. Угловое преобразование (φ*) сравнивает две доли через перевод процентов в углы. Совпало только имя автора.
Можно ли применять его к таблицам больше 2×2?
Классический точный критерий Фишера создан для 2×2. Существуют обобщения на таблицы r×c, и некоторые программы их умеют, но в студенческих работах почти всегда речь именно о 2×2. Для больших таблиц с нормальными частотами берут хи-квадрат.
Какое p-значение брать — одностороннее или двустороннее?
По умолчанию в дипломе используют двустороннее (проверяет различие «в любую сторону») — оно строже и безопаснее. Одностороннее берут, только если заранее, до сбора данных, обоснована гипотеза о направлении различия. В тексте всегда уточняйте, какое именно вы привели.
Нужно ли вообще проверять хи-квадрат, или можно сразу считать Фишера?
Можно сразу считать точный критерий Фишера — на таблице 2×2 он корректен всегда, и на маленькой, и на большой выборке. Хи-квадрат предпочитают на больших данных лишь по традиции и из-за привычного «χ² = …; p = …». Если сомневаетесь, есть ли в ячейках хотя бы 5 ожидаемых наблюдений, — берите Фишера, не ошибётесь.
Какой нужен размер выборки?
Формального минимума нет — метод работает даже при нескольких наблюдениях в группе, и в этом его смысл. Но помните: чем меньше людей, тем труднее получить значимый результат, даже если различие реально. Сколько респондентов закладывать в работу, разбираем в статье «Сколько респондентов нужно для диплома».
Короткий алгоритм
- Сведите данные в таблицу 2×2: две группы (строки) и признак «да/нет» (столбцы).
- Прикиньте ожидаемые частоты. Если хотя бы в одной клетке < 5 — хи-квадрат не подходит.
- Посчитайте точный критерий Фишера — он даст p-значение напрямую.
- Сравните p с 0,05: меньше — различие значимо, больше или равно — значимых различий нет.
- В диплом впишите метод, p-значение и проценты по группам, сошлитесь на таблицу.
Короче: таблица 2×2 + малые частоты → точный критерий Фишера; большая таблица или достаточные частоты → хи-квадрат; сравнение двух долей → можно и угловой φ*.
Что ещё почитать
- Хи-квадрат или критерий Фишера (φ*): что выбрать — как развести два «Фишера» и хи-квадрат.
- Руководство по критерию хи-квадрат — как строить таблицу сопряжённости и считать χ².
- Как выбрать статистический критерий для диплома — общая схема выбора метода.
- Что такое p-значение простыми словами — как читать результат любого критерия.
- Калькулятор хи-квадрат и калькулятор φ* Фишера — посчитать онлайн.
Не уверены, какой критерий подходит вашим данным, — загляните в базу методов или закажите консультацию: эксперт подберёт метод и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию