Практика12 июня 2026·9 мин чтения

Как показать рост спортивных результатов статистикой

Как доказать улучшение времени, дистанции и баллов цифрами, а не «на глаз»: до/после Вилкоксон, размер прироста и динамика по замерам. С примерами и FAQ.

Вы провели эксперимент: спортсмены тренировались по вашей программе, и результаты «вроде бы» подросли. Но руководитель спрашивает: а это точно ваша программа, а не случайность или просто хороший день?

Чтобы ответить «да» уверенно, недостаточно показать, что среднее время улучшилось. Нужно доказать сдвиг статистикой — критерием и p-значением. Разберём, как это сделать просто.

В двух словах

Замеры до и после у одних и тех же спортсменов сравнивают критерием Вилкоксона — он работает и с временем/дистанцией, и с баллами, и не боится выбросов.
Если замеров три и больше (вход, середина, выход) — берут критерий Фридмана.
Мало просто «значимо»: покажите размер прироста — на сколько секунд, метров или баллов стало лучше.

Важно

В беге и плавании меньшее время — это лучший результат. Снижение секунд = улучшение. Об этом легко забыть и сделать вывод наоборот, поэтому держите направление в голове с самого начала.

Зачем вообще критерий, если и так видно рост

Среднее время бега упало с 14,8 до 14,2 секунды. Кажется — победа. Но цифры всегда немного «гуляют»: настроение, погода, как поспал спортсмен. Критерий отвечает на вопрос: этот сдвиг больше, чем обычные случайные колебания, или нет?

Главный результат критерия — p-значение (подробнее в статье «Что такое p-значение»). Читается просто:

p < 0,05 — сдвиг статистически значим, программа сработала;
p > 0,05 — изменения в пределах случайности, доказать эффект не вышло.

Пример. Тренер уверен, что прыжок в длину вырос. Среднее правда поднялось на 4 см. Но критерий дал p = 0,18 — разброс между спортсменами слишком большой, и такой прирост мог получиться случайно. Вывод «программа работает» пока не доказан.

Как сравнить «до» и «после»: критерий Вилкоксона

Самая частая ситуация в спортивном дипломе — два замера у одной и той же группы: до начала программы и после неё. Для этого создан критерий Вилкоксона.

Он не работает со средними напрямую. Вместо этого он смотрит на сдвиги у каждого спортсмена (после минус до), ранжирует их по величине и проверяет, чего весомее — улучшений или ухудшений. Поэтому один спортсмен-«выброс» почти не ломает результат.

Почему именно Вилкоксон, а не критерий Стьюдента:

Подходит всем типам данных. Время, метры, баллы тестов, число попаданий — всё годится.
Не требует нормальности. В спорте выборки маленькие (часто 10–20 человек), и проверить нормальность толком нельзя — Вилкоксон корректен и без неё.
Устойчив к выбросам. Один спортсмен, у которого результат скакнул из-за травмы, не перевернёт вывод.

Совет

Если данные числовые (время, дистанция) и их распределение действительно нормальное, можно взять и парный критерий Стьюдента — он чуть мощнее. Сомневаетесь? Берите Вилкоксона: он корректен всегда. Подробно эту развилку разбирает статья «Стьюдент или Вилкоксон».

Пример. У 18 пловцов замерили время на 50 м вольным стилем до и после 8 недель тренировок. Время у каждого снизилось в среднем на 0,9 секунды. Вилкоксон дал T = 24, p < 0,05 — улучшение значимо.

Не забудьте про размер прироста

P-значение говорит только «сдвиг есть». Но эксперта и читателя волнует и второе: насколько именно стало лучше? Это и есть размер прироста — самое наглядное в работе.

Покажите его в понятных единицах:

В абсолюте. «Время на 100 м снизилось в среднем на 0,6 с».
В процентах. «Дальность броска выросла на 7,5 %».
По медианам. «Медиана числа отжиманий поднялась с 28 до 35 раз».

Заметка

Маленькое p и большой прирост — это разные вещи. Можно получить значимый, но крошечный сдвиг (например, минус 0,1 секунды), который на практике почти ничего не значит. Поэтому всегда показывайте обе цифры: и значимость, и величину эффекта.

Пример. Две группы дали одинаковое p < 0,05. Но в первой прыжок вырос на 2 см, а во второй — на 11 см. Статистика «значима» у обеих, а вот практическая польза несравнима — и это видно только по размеру прироста.

Если замеров несколько: критерий Фридмана

Иногда вы измеряете результат не дважды, а в несколько этапов: на входе, в середине цикла и на выходе. Сравнивать их попарно Вилкоксоном по очереди — ошибка: чем больше сравнений, тебе выше шанс «поймать» случайную значимость (об этом — статья «Множественные сравнения и поправка Бонферрони»).

Правильно — взять критерий Фридмана. Это «Вилкоксон для трёх и более связанных замеров»: он проверяет сразу, есть ли вообще динамика по всем точкам.

Пример. Силу хвата у 15 борцов измерили трижды: до сборов, через 2 недели и через 4. Критерий Фридмана показал значимые различия (p < 0,05) — сила менялась по ходу подготовки, а не стояла на месте.

Если Фридман нашёл различия, дальше можно уточнить попарно, между какими именно замерами разница (с поправкой на число сравнений).

Пример с расчётом и диаграммой

Соберём всё вместе. Группа из 20 бегунов, дистанция 100 м, замеры до и после программы. Меньшее время — лучше. Результаты сравнения по Вилкоксону представлены в таблице 1.

Таблица 1 — Динамика результата в беге на 100 м до и после программы по критерию Вилкоксона (n = 20)

Показатель	Me до, с	Me после, с	Прирост	T эмп	T крит (p ≤ 0,05)	Вывод
Время на 100 м	14,8	14,2	−0,6 с (−4 %)	31	52	сдвиг значим (p < 0,05)

После таблицы — вывод словами: «Время на дистанции 100 м после программы значимо снизилось: медиана упала с 14,8 до 14,2 с (T = 31 < T₍₀,₀₅₎ = 52; p < 0,05)». Для Вилкоксона помните правило: значимость есть, когда T эмпирическое меньше или равно T критическому — это противоположно тому, как сравнивают у Стьюдента.

Наглядно динамику показывает рисунок 1. Обратите внимание: столбик «после» ниже, и для бега это хорошо — времени стало меньше.

Рисунок 1 — Медиана времени бега на 100 м до и после программы (n = 20)

Что писать в дипломе

Готовые формулировки — подставьте свои числа.

Когда сдвиг значим:

«Результат в беге на 100 м после реализации программы статистически значимо улучшился: медиана времени снизилась с 14,8 до 14,2 с (критерий Вилкоксона, T = 31, p < 0,05)».
«По критерию Фридмана выявлена значимая динамика силы хвата на трёх этапах подготовки (χ² = 12,4; p < 0,05)».

Когда сдвига нет:

«Статистически значимых изменений дальности броска не выявлено (T = 58; p = 0,21), что может быть связано с малым объёмом выборки».

К критерию обязательно добавьте размер прироста: средние или медианы «до» и «после» и разницу в единицах или процентах.

Вывод

Рабочая связка для спортивного диплома: медиана до → медиана после → прирост в единицах/процентах → критерий с T (или χ²) и p. Эти четыре элемента превращают «вроде стало лучше» в доказанный факт.

Частые ошибки

Перепутать направление в беге и плавании. Меньшее время — лучше. Снижение секунд — это рост результата, а не падение.
Делать вывод по одному среднему. «Среднее улучшилось» без критерия и p — не доказательство.
Сравнивать три замера Вилкоксоном попарно. Для трёх и более точек нужен Фридман, иначе завысите значимость.
Брать Вилкоксона для двух разных групп. Он для одних и тех же спортсменов дважды. Для контрольной и экспериментальной групп — Манна-Уитни.
Забыть про размер прироста. Значимость без величины эффекта оставляет работу неполной.

Частые вопросы

У меня контрольная и экспериментальная группа — тоже Вилкоксон?

Нет. Вилкоксон сравнивает один и тот же состав до и после. Две разные группы людей сравнивают критерием Манна-Уитни. Часто в дипломе нужно и то, и другое: Манна-Уитни — чтобы показать, что группы на старте были равны, и Вилкоксон — чтобы показать сдвиг внутри каждой.

Сколько спортсменов нужно для расчёта?

Вилкоксон формально работает от ~6 пар, но чем больше, тем надёжнее. Для спортивных работ обычно берут 12–30 человек. Подробнее — в статье «Сколько респондентов нужно для диплома».

А если у двух спортсменов результат не изменился?

Пары с нулевым сдвигом (до = после) из расчёта Вилкоксона обычно исключаются, и объём выборки для критерия слегка уменьшается. Это нормально, просто отметьте это в работе.

Чем меньше p, тем сильнее эффект?

Нет. P говорит только о том, что сдвиг не случаен, но не о его величине. Сильный эффект показывает размер прироста (секунды, метры, проценты), а не маленькое p. О величине эффекта — статья «Размер эффекта d Коэна».

Нужно ли проверять нормальность перед Вилкоксоном?

Нет — это его плюс. Нормальность нужна параметрическим методам (Стьюдент). Вилкоксон и Фридман непараметрические и работают без этого условия. О разнице — статья «Параметрические и непараметрические критерии».

Короткий алгоритм

Определите тип сравнения. Одни и те же спортсмены до/после? Тогда связанные выборки.
Считайте замеры. Два замера → Вилкоксон. Три и больше → Фридман.
Помните направление. В беге/плавании меньшее время — лучше.
Получите p. p < 0,05 — сдвиг значим; p > 0,05 — нет.
Добавьте прирост. Медианы «до» и «после» плюс разница в единицах или процентах.
Опишите словами. Критерий, его статистику (T или χ²), n и p — в текст диплома.

Что ещё почитать

Эффективность тренировки: как доказать статистикой — соседняя тема про сравнение программ.
Руководство по критерию Вилкоксона — пошагово, с расчётом вручную.
Руководство по критерию Фридмана — для нескольких замеров.
Обработка функциональных проб в дипломе — если меряете пробы Штанге, Генчи и т. п.
Как описать результаты статистики — чтобы грамотно изложить выводы.

Не уверены, какой критерий взять для вашего эксперимента — загляните в базу методов или закажите консультацию: эксперт подберёт метод и посчитает за вас.

Не хотите разбираться со статистикой сами?

Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.

Заказать консультацию