Биномиальный критерий и сравнение долей
Как проверить, отличается ли доля от заданной (например, 0,5), и как сравнить доли в двух группах. Простая логика, что писать в дипломе, с примерами и FAQ.
У вас есть не числа и не баллы, а ответы «да/нет», «выбрал/не выбрал», «попал/не попал». И вопрос: эта доля случайная или закономерная? Например, 34 человека из 50 выбрали первый вариант — это «больше половины по делу» или просто как монетка легла?
На такие вопросы отвечает биномиальный критерий: он проверяет, отличается ли наблюдаемая доля от заданной (чаще всего от 0,5). А если групп две и вы сравниваете доли между ними — нужен немного другой инструмент. Разберём оба случая по-человечески.
В двух словах
- Биномиальный критерий проверяет одну долю против заданного числа: «доля выбравших вариант А отличается от 50%?». Считается точно, даже на маленькой выборке.
- Если нужно сравнить две доли (мужчины vs женщины, контроль vs эксперимент) — берите критерий хи-квадрат или угловое преобразование Фишера. Какой из двух — разобрано в статье «Хи-квадрат или Фишера».
Главное различие держите в голове сразу: биномиальный — про одну долю и эталон, хи-квадрат и Фишер — про разницу между двумя долями.
Что такое доля и зачем её проверять
Доля — это просто «сколько из всех». 30 из 50 — это доля 0,6, или 60%. Ничего сложного.
Проблема в другом: любая доля «гуляет» от выборки к выборке. Подбросьте монетку 10 раз — редко выпадет ровно 5 орлов, чаще 4 или 6, бывает и 7. Значит, отклонение от половины само по себе ещё ничего не доказывает: надо понять, насколько оно велико для вашего числа наблюдений.
Биномиальный критерий как раз и отвечает: «если бы на самом деле доля была равна эталонной (скажем, 0,5), какова вероятность случайно получить такое же или ещё более сильное отклонение, как у вас?». Эта вероятность и есть p-значение — о нём подробно в статье «Что такое p-value».
Биномиальный критерий работает с дихотомией — признаком, у которого ровно два исхода: да/нет, есть/нет, выбрал/не выбрал. Если вариантов три и больше (выбрал А, Б или В), один биномиальный тест уже не подходит — там нужен хи-квадрат.
Когда брать биномиальный критерий
Берите его, когда совпадает всё:
- Признак с двумя исходами. Каждый человек попадает в одну из двух категорий: согласен/нет, прошёл/не прошёл, предпочёл вариант 1/вариант 2.
- Есть «эталонная» доля для сравнения. Чаще всего это 0,5 («поровну, как случайный выбор»), но бывает и другое число — например, известная норма 0,25.
- Одна группа. Вы смотрите на один набор людей, а не сравниваете две выборки между собой.
Пример. В опроснике 60 студентов выбирали между двумя формулировками задания. Первую выбрали 39 человек. Вопрос: «доля 39/60 отличается от случайных 50%?» — это ровно случай для биномиального критерия.
Пример. Тест на профпригодность: норма успешного выполнения — 75% заданий. Спортсмен из 20 попыток выполнил 12 удачных (доля 0,6). Проверяем, значимо ли он не дотягивает до нормы 0,75 — снова биномиальный критерий, но эталон теперь не 0,5, а 0,75.
Когда брать сравнение долей
Как только групп становится две и вы сравниваете доли между ними — биномиальный критерий уже не годится. Здесь работают:
- Хи-квадрат. Универсальный критерий для таблиц «группа × категория». Хорош, когда выборки не совсем маленькие.
- Угловое преобразование Фишера (φ*). Любимец психологов и педагогов: надёжно работает даже на небольших группах и когда одна из долей близка к 0% или 100%.
Пример. В контрольной группе тренинг прошли успешно 12 из 30 человек (40%), в экспериментальной — 21 из 30 (70%). Вопрос «отличается ли доля успеха между группами?» — это уже сравнение двух долей, берите Фишера или хи-квадрат, а не биномиальный.
Простой ориентир: спросите себя, сколько у вас процентов. Один процент сравниваете с числом (50%, 75%) → биномиальный. Два процента сравниваете между собой (40% против 70%) → хи-квадрат или Фишер.
Как это работает по-простому
Биномиальный критерий ничего не «усредняет» и не округляет — он считает вероятность напрямую, перебирая все исходы. Логика такая:
- Представьте, что эталон верен и доля реально 0,5.
- Тогда можно посчитать, с какой вероятностью выпадет ровно ваше число «успехов», ровно на один больше, ещё больше — и так до края.
- Сложите вероятности всех исходов, которые отклонены от середины не слабее вашего. Это и есть p-значение.
Если эта вероятность мала (меньше 0,05) — случайностью ваше отклонение объяснить трудно, доля значимо отличается от эталона. Если велика — отклонение в пределах обычного «дрожания», и говорить о закономерности нельзя.
Сравнение долей в двух группах устроено иначе: хи-квадрат и Фишер смотрят не на эталон, а на то, сильнее ли разошлись доли двух групп, чем можно объяснить случайностью при одинаковой «истинной» доле.
Пример с расчётом и оформлением
Возьмём первый пример: 39 из 60 студентов выбрали первую формулировку. Эталон — 0,5 (если бы выбор был случайным, ждали бы примерно 30 на 30). Наблюдаемая доля — 0,65.
На таблицу в тексте ссылаются прямо: «Результаты проверки приведены в таблице 1». Подпись таблицы ставят сверху.
Таблица 1 — Проверка доли выбора первого варианта против эталона 0,5 (n = 60)
| Показатель | Значение |
|---|---|
| Выбрали вариант 1 | 39 из 60 |
| Наблюдаемая доля | 0,65 |
| Эталонная доля | 0,50 |
| p (двусторонний) | 0,028 |
| Вывод | доля значимо выше 0,5 (p < 0,05) |
После таблицы — вывод словами: «Доля студентов, выбравших первую формулировку (0,65), статистически значимо превышает случайные 0,5 (p = 0,028)». Иначе говоря, выбор не случаен — первый вариант предпочитают закономерно чаще.
Если бы вместо одной группы вы сравнивали два курса между собой, в таблицу пошли бы две доли и итог критерия Фишера или хи-квадрата — а вывод звучал бы как «доли значимо различаются».
Что писать в дипломе
Главный показатель после расчёта — p-значение:
- p < 0,05 — доля значимо отличается от эталона (или доли групп значимо различаются);
- p > 0,05 — значимых отличий нет, отклонение можно объяснить случайностью.
Готовые формулировки для биномиального критерия:
- «Доля выбравших первый вариант (0,65; 39 из 60) статистически значимо превышает 0,5 (биномиальный критерий, p = 0,028)».
- «Доля успешного выполнения нормы (0,60; 12 из 20) значимо не отличается от ожидаемой 0,75 (биномиальный критерий, p = 0,18)».
Готовые формулировки для сравнения двух долей:
- «Доля успеха в экспериментальной группе (70%) статистически значимо выше, чем в контрольной (40%) (φ* = 2,35; p < 0,01)».
- «Различия в доле выбравших вариант А между группами не достигли значимости (χ² = 1,8; p = 0,18)».
В выводе всегда показывайте три вещи: саму долю (в процентах или как «39 из 60»), эталон или вторую долю, с которой сравниваете, и p-значение. Фраза «большинство выбрало первый вариант» без этих чисел доказательством не считается.
Частые ошибки
- Сравнивать две доли биномиальным критерием. Он только для одной доли против эталона. Две группы → хи-квадрат или Фишер.
- Считать проценты, а не людей. Критериям нужны абсолютные числа («39 из 60»), а не голые «65%». Из одного процента не видно размера выборки: 65% — это 13 из 20 или 650 из 1000? Выводы будут разные.
- Применять к трём и более категориям. Если вариантов выбора три (А, Б, В), один биномиальный тест не подходит — берите хи-квадрат на согласие частот.
- Путать долю с числовым показателем. Если у вас не «да/нет», а баллы или измерения, доли тут ни при чём — нужны Стьюдент, Манна-Уитни и подобные. Сориентироваться поможет статья «Как выбрать критерий».
- Брать эталон 0,5 «по привычке». Если в задаче есть своя норма (например, 0,25 для четырёх равновероятных вариантов), сравнивать надо именно с ней.
Частые вопросы
Чем биномиальный критерий отличается от хи-квадрата?
Биномиальный сравнивает одну долю с заданным числом и считает вероятность точно — это идеально для маленьких выборок и дихотомии «да/нет». Хи-квадрат универсальнее: он проверяет согласие частот в таблице и умеет сравнивать несколько групп и категорий, но на очень малых числах работает хуже.
А если выборка совсем маленькая, 10–15 человек?
Это как раз сильная сторона биномиального критерия: он точный и корректен даже на маленьких числах, в отличие от хи-квадрата, который на малых выборках завышает значимость. Для сравнения двух маленьких групп берите угловое преобразование Фишера — оно специально хорошо на небольших выборках.
Что значит «двусторонний» и «односторонний» критерий?
Двусторонний проверяет отклонение в любую сторону («доля отличается от 0,5 — выше или ниже»). Односторонний — только в заранее названную («доля выше 0,5»). По умолчанию в дипломе берут двусторонний: он строже и не требует заранее угадывать направление.
Можно ли так проверить ответы по одному пункту анкеты?
Да. Если пункт даёт ответ «согласен / не согласен», биномиальный критерий покажет, значимо ли согласных больше (или меньше) половины. Как в целом обсчитывать опросник — в статье «Как обработать опросник в дипломе».
Нужно ли проверять нормальность распределения?
Нет. Доли и частоты — это не числовые измерения, понятие нормальности к ним не применяется. Проверка нормальности нужна для критериев вроде Стьюдента, а не для биномиального, хи-квадрата или Фишера.
Короткий алгоритм
- Признак — «да/нет» (дихотомия)? Если нет (баллы, измерения) → вам нужны другие критерии, загляните в гид по выбору.
- У вас одна группа и эталонная доля (0,5; 0,75…)? → биномиальный критерий.
- У вас две группы и вы сравниваете их доли? → хи-квадрат или Фишер (что выбрать — в этой статье).
- Запишите в дипломе долю, эталон/вторую долю и p-значение.
Короче: одна доля против числа → биномиальный; две доли друг против друга → хи-квадрат или Фишер. Нормальность здесь не проверяют, а в критерий подают абсолютные числа, а не проценты.
Что ещё почитать
- Хи-квадрат или Фишера: что выбрать — как сравнить две доли правильно.
- Как выбрать статистический критерий — общая схема под любой тип данных.
- Что такое p-value простыми словами — как читать результат.
- Калькулятор хи-квадрат и калькулятор углового преобразования Фишера — посчитать сравнение долей онлайн.
Не уверены, какой критерий нужен под ваши данные — посмотрите базу методов или закажите консультацию: эксперт подберёт критерий и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию