Как проверить нормальность в SPSS и Excel
Пошагово: тесты Шапиро-Уилка и Колмогорова-Смирнова, гистограмма, асимметрия и эксцесс. Как прочитать результат и выбрать параметрику или непараметрику — с примерами и FAQ.
Прежде чем сравнивать группы или искать связи, нужно ответить на один вопрос: распределены ли ваши данные «нормально»? От этого зависит, какой критерий брать — параметрический или непараметрический.
Звучит страшно, но на деле это пара кликов в SPSS или одна формула в Excel. Разберём по шагам, что нажимать и как прочитать результат.
В двух словах
- Самый простой путь — посчитать тест Шапиро-Уилка: если p > 0,05, распределение можно считать нормальным, и подойдут параметрические методы.
- Для больших выборок (примерно от 50 человек) чаще смотрят на критерий Колмогорова-Смирнова и на форму гистограммы.
- Вывод простой: нормально → параметрика (Стьюдент, Пирсон, ANOVA); ненормально → непараметрика (Манна-Уитни, Спирмен).
Зачем вообще нужна нормальность и что это за «колокол» — подробно в статье «Нормальное распределение». Здесь — чистая практика.
Что значит «нормальное распределение»
Нормальное распределение — это когда большинство значений толпится вокруг середины, а редкие очень большие и очень маленькие значения встречаются примерно одинаково по обе стороны. На графике получается симметричный холм-колокол.
Пример. Рост взрослых мужчин: большинство около 175-180 см, людей под 150 и под 210 см очень мало, и таких «коротышек» и «великанов» примерно поровну. Это типичный «колокол».
Многие параметрические методы (Стьюдент, Пирсон, ANOVA) считают средние и стандартные отклонения и втайне предполагают, что данные распределены именно так. Если это не выполняется, выводы могут «поплыть» — поэтому нормальность и проверяют заранее.
Нормальность нужна не всегда у «сырых» данных. Для парного критерия Стьюдента и корреляции важна нормальность не самих значений, а разностей или связи переменных. Но для первого знакомства достаточно проверить распределение каждого показателя.
Проверка нормальности в SPSS
В SPSS есть готовая процедура, которая разом выдаёт и тесты, и графики. Идём по меню: Analyze → Descriptive Statistics → Explore.
Шаг 1. Перенесите нужную переменную (например, «уровень тревожности») в поле Dependent List.
Шаг 2. Нажмите кнопку Plots, поставьте галочку Normality plots with tests и при желании Histogram. Нажмите Continue, затем OK.
SPSS выдаст несколько таблиц и графиков. Нас интересуют три вещи.
Тесты Шапиро-Уилка и Колмогорова-Смирнова
В таблице Tests of Normality будет две строки. Смотрите на столбец Sig. — это и есть p-значение (что это такое — в статье «Что такое p-значение»).
- Shapiro-Wilk — основной тест для небольших выборок (примерно до 50 человек). Он чувствительнее.
- Kolmogorov-Smirnov — его обычно смотрят на больших выборках.
Правило одно: если Sig. (p) больше 0,05 — распределение нормальное, можно брать параметрику. Если p ≤ 0,05 — отклонение от нормы значимо, переходите к непараметрике.
Пример. SPSS показал для шкалы тревожности Shapiro-Wilk Sig. = 0,312. Это больше 0,05 → распределение нормальное → для сравнения «до/после» подойдёт парный критерий Стьюдента.
Не путайте логику с критериями вроде Стьюдента. Здесь нулевая гипотеза — «данные нормальны». Поэтому большое p (> 0,05) — это хорошо, оно означает «нормально». А маленькое p говорит, что распределение отличается от нормального.
Гистограмма
Гистограмма — это столбчатый график, который показывает, сколько значений попало в каждый диапазон. Если данные нормальны, столбики складываются в симметричный холм с вершиной посередине.
Смотрите на форму: один горб по центру — хороший знак. Два горба, длинный «хвост» вправо или влево, перекос — повод насторожиться.
Асимметрия и эксцесс
В таблице Descriptives найдите строки Skewness (асимметрия) и Kurtosis (эксцесс). Это два числа, которые описывают форму распределения:
- Асимметрия (Skewness) — перекошен ли «колокол» влево или вправо. У идеально симметричного распределения она равна 0.
- Эксцесс (Kurtosis) — насколько острая или плоская вершина по сравнению с нормой.
Грубое практическое правило: если оба показателя по модулю не превышают примерно 1 (в мягком варианте — до 2), форма близка к нормальной. Подробнее — в статье «Асимметрия и эксцесс».
Рядом с каждым значением SPSS печатает Std. Error (стандартную ошибку). Если поделить асимметрию на её ошибку и получить число по модулю меньше 2, перекос можно считать незначимым. Это удобный запасной критерий, когда тесты на грани.
Проверка нормальности в Excel
В Excel нет кнопки «тест Шапиро-Уилка», но базовую проверку формы сделать можно: посчитать асимметрию и построить гистограмму.
Асимметрия и эксцесс формулами
Введите данные в один столбец (например, A2:A41) и используйте встроенные функции:
- асимметрия —
=СКОС(A2:A41)(в англоязычной версии=SKEW(...)); - эксцесс —
=ЭКСЦЕСС(A2:A41)(=KURT(...)).
Читаются они так же, как в SPSS: чем ближе оба числа к нулю, тем симметричнее и «нормальнее» форма. Значения в пределах ±1 — хороший признак.
Пример. По 30 баллам опросника Excel выдал
СКОС= 0,18 иЭКСЦЕСС= −0,42. Оба близки к нулю → распределение похоже на нормальное → можно осторожно использовать параметрику.
Гистограмма в Excel
Выделите столбец с данными и постройте диаграмму: Вставка → Гистограмма. В свежих версиях Excel есть отдельный тип «Гистограмма», который сам разбивает данные на интервалы.
Смотрите на ту же форму холма: симметричный пик по центру — нормально, сильный перекос или два горба — нет.
Важно помнить: Excel удобен для прикидки, но он не даёт p-значения для нормальности. Для диплома надёжнее посчитать Шапиро-Уилка или Колмогорова-Смирнова — онлайн это делается за пару минут, и в работу можно вставить готовое p.
Как прочитать результат и выбрать метод
Соберём все признаки в одну таблицу — по ней удобно принимать решение. На неё в тексте ссылаются так: «критерии нормальности обобщены в таблице 1».
Таблица 1 — Признаки нормального и ненормального распределения
| Признак | Нормально | Ненормально |
|---|---|---|
| Шапиро-Уилк / К-С (Sig.) | p > 0,05 | p ≤ 0,05 |
| Асимметрия (Skewness) | около 0 (по модулю < 1) | сильный перекос (по модулю > 1) |
| Эксцесс (Kurtosis) | около 0 (по модулю < 1) | очень острый/плоский пик |
| Гистограмма | симметричный холм | перекос, два горба, длинный хвост |
| Что брать | параметрика | непараметрика |
Не требуйте, чтобы все четыре признака были идеальны. Опирайтесь в первую очередь на тест (Шапиро-Уилк) и форму гистограммы, а асимметрия с эксцессом — подтверждающие.
Что писать в дипломе
В тексте работы достаточно одного-двух предложений на каждый показатель. Главное — назвать критерий, привести его значение и p, а затем сделать вывод о выборе методов.
Готовые формулировки для случая, когда распределение нормальное:
- «Проверка нормальности по критерию Шапиро-Уилка показала, что распределение показателя не отличается значимо от нормального (W = 0,96; p = 0,31), поэтому для дальнейшего анализа применялись параметрические методы».
- «Значения асимметрии (0,18) и эксцесса (−0,42) близки к нулю, что подтверждает нормальность распределения».
Если распределение ненормальное:
- «Распределение показателя значимо отличается от нормального (W = 0,88; p = 0,01), поэтому использовались непараметрические критерии».
- «Выраженная правосторонняя асимметрия (1,9) указывает на отклонение от нормального распределения».
Шаблон вывода: «Так как p {больше / меньше} 0,05, распределение {нормальное / отличается от нормального}, поэтому далее применялись {параметрические / непараметрические} критерии». Подставьте свои числа — и предложение готово.
Частые ошибки
- Путать направление вывода. Здесь большое p (> 0,05) означает «нормально». Многие по привычке считают наоборот.
- Слепо верить только тесту на больших выборках. При n в несколько сотен Шапиро-Уилк отвергает нормальность из-за крошечных отклонений. Тогда сильнее опирайтесь на гистограмму, асимметрию и эксцесс.
- Проверять не то. Для парного Стьюдента нормальность нужна у разностей «после − до», а не у исходных значений.
- Проверять нормальность по всей выборке сразу для двух групп. Распределение проверяют отдельно в каждой группе, которую потом сравнивают.
- Считать асимметрию «на глаз» без числа. В диплом нужна конкретика: значение показателя и p, а не «график выглядит нормальным».
Частые вопросы
Какой тест выбрать — Шапиро-Уилка или Колмогорова-Смирнова?
Для большинства студенческих выборок (до 50 человек) берите Шапиро-Уилка — он точнее на малых данных. Колмогорова-Смирнова традиционно приводят для больших выборок. Часто в дипломе указывают оба.
Что делать, если данные оказались ненормальными?
Ничего страшного — это не ошибка, а свойство данных. Просто берите непараметрические аналоги: вместо Стьюдента — Манна-Уитни или Вилкоксона, вместо Пирсона — Спирмена, вместо ANOVA — Краскела-Уоллиса.
Сколько респондентов нужно, чтобы проверка была надёжной?
Совсем на маленьких выборках (меньше 8-10 человек) любой тест нормальности слабый и почти ничего не «ловит». Чем больше данных, тем надёжнее вывод. О размере выборки — отдельная статья «Сколько респондентов нужно».
Нужно ли проверять нормальность для балльных анкет?
Часто нет. Баллы опросников — это порядковая шкала (подробнее про шкалы измерения), и для них многие сразу берут непараметрику, не тратя время на проверку. Уточните требования у научного руководителя.
Что если разные признаки дали разный результат?
Это нормально. Метод выбирают под каждый показатель отдельно: для нормального — параметрику, для ненормального — непараметрику. Не обязательно «причёсывать» всю работу под один критерий.
Короткий алгоритм
- В SPSS: Analyze → Descriptive Statistics → Explore, в Plots включите Normality plots with tests и Histogram.
- Посмотрите столбец Sig. у Шапиро-Уилка: p > 0,05 — нормально, p ≤ 0,05 — нет.
- Проверьте гистограмму (симметричный холм?) и значения асимметрии с эксцессом (около нуля?).
- В Excel для прикидки:
=СКОС(),=ЭКСЦЕСС()и диаграмма-гистограмма. - Нормально → параметрика; ненормально → непараметрика.
- Запишите в диплом критерий, его значение, p и вывод о выборе методов.
Что ещё почитать
- Как проверить нормальность распределения — теория и логика проверки.
- Асимметрия и эксцесс простыми словами — как читать форму распределения.
- Параметрические и непараметрические критерии — что выбрать после проверки.
- Калькулятор Шапиро-Уилка и Колмогорова-Смирнова — посчитать онлайн.
Не уверены, что данные нормальны и какой критерий брать — загляните в базу методов или закажите консультацию: эксперт проверит распределение и подберёт корректный метод.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию