Как показать рост спортивных результатов статистикой
Как доказать улучшение времени, дистанции и баллов цифрами, а не «на глаз»: до/после Вилкоксон, размер прироста и динамика по замерам. С примерами и FAQ.
Вы провели эксперимент: спортсмены тренировались по вашей программе, и результаты «вроде бы» подросли. Но руководитель спрашивает: а это точно ваша программа, а не случайность или просто хороший день?
Чтобы ответить «да» уверенно, недостаточно показать, что среднее время улучшилось. Нужно доказать сдвиг статистикой — критерием и p-значением. Разберём, как это сделать просто.
В двух словах
- Замеры до и после у одних и тех же спортсменов сравнивают критерием Вилкоксона — он работает и с временем/дистанцией, и с баллами, и не боится выбросов.
- Если замеров три и больше (вход, середина, выход) — берут критерий Фридмана.
- Мало просто «значимо»: покажите размер прироста — на сколько секунд, метров или баллов стало лучше.
В беге и плавании меньшее время — это лучший результат. Снижение секунд = улучшение. Об этом легко забыть и сделать вывод наоборот, поэтому держите направление в голове с самого начала.
Зачем вообще критерий, если и так видно рост
Среднее время бега упало с 14,8 до 14,2 секунды. Кажется — победа. Но цифры всегда немного «гуляют»: настроение, погода, как поспал спортсмен. Критерий отвечает на вопрос: этот сдвиг больше, чем обычные случайные колебания, или нет?
Главный результат критерия — p-значение (подробнее в статье «Что такое p-значение»). Читается просто:
- p < 0,05 — сдвиг статистически значим, программа сработала;
- p > 0,05 — изменения в пределах случайности, доказать эффект не вышло.
Пример. Тренер уверен, что прыжок в длину вырос. Среднее правда поднялось на 4 см. Но критерий дал p = 0,18 — разброс между спортсменами слишком большой, и такой прирост мог получиться случайно. Вывод «программа работает» пока не доказан.
Как сравнить «до» и «после»: критерий Вилкоксона
Самая частая ситуация в спортивном дипломе — два замера у одной и той же группы: до начала программы и после неё. Для этого создан критерий Вилкоксона.
Он не работает со средними напрямую. Вместо этого он смотрит на сдвиги у каждого спортсмена (после минус до), ранжирует их по величине и проверяет, чего весомее — улучшений или ухудшений. Поэтому один спортсмен-«выброс» почти не ломает результат.
Почему именно Вилкоксон, а не критерий Стьюдента:
- Подходит всем типам данных. Время, метры, баллы тестов, число попаданий — всё годится.
- Не требует нормальности. В спорте выборки маленькие (часто 10–20 человек), и проверить нормальность толком нельзя — Вилкоксон корректен и без неё.
- Устойчив к выбросам. Один спортсмен, у которого результат скакнул из-за травмы, не перевернёт вывод.
Если данные числовые (время, дистанция) и их распределение действительно нормальное, можно взять и парный критерий Стьюдента — он чуть мощнее. Сомневаетесь? Берите Вилкоксона: он корректен всегда. Подробно эту развилку разбирает статья «Стьюдент или Вилкоксон».
Пример. У 18 пловцов замерили время на 50 м вольным стилем до и после 8 недель тренировок. Время у каждого снизилось в среднем на 0,9 секунды. Вилкоксон дал T = 24, p < 0,05 — улучшение значимо.
Не забудьте про размер прироста
P-значение говорит только «сдвиг есть». Но эксперта и читателя волнует и второе: насколько именно стало лучше? Это и есть размер прироста — самое наглядное в работе.
Покажите его в понятных единицах:
- В абсолюте. «Время на 100 м снизилось в среднем на 0,6 с».
- В процентах. «Дальность броска выросла на 7,5 %».
- По медианам. «Медиана числа отжиманий поднялась с 28 до 35 раз».
Маленькое p и большой прирост — это разные вещи. Можно получить значимый, но крошечный сдвиг (например, минус 0,1 секунды), который на практике почти ничего не значит. Поэтому всегда показывайте обе цифры: и значимость, и величину эффекта.
Пример. Две группы дали одинаковое p < 0,05. Но в первой прыжок вырос на 2 см, а во второй — на 11 см. Статистика «значима» у обеих, а вот практическая польза несравнима — и это видно только по размеру прироста.
Если замеров несколько: критерий Фридмана
Иногда вы измеряете результат не дважды, а в несколько этапов: на входе, в середине цикла и на выходе. Сравнивать их попарно Вилкоксоном по очереди — ошибка: чем больше сравнений, тебе выше шанс «поймать» случайную значимость (об этом — статья «Множественные сравнения и поправка Бонферрони»).
Правильно — взять критерий Фридмана. Это «Вилкоксон для трёх и более связанных замеров»: он проверяет сразу, есть ли вообще динамика по всем точкам.
Пример. Силу хвата у 15 борцов измерили трижды: до сборов, через 2 недели и через 4. Критерий Фридмана показал значимые различия (p < 0,05) — сила менялась по ходу подготовки, а не стояла на месте.
Если Фридман нашёл различия, дальше можно уточнить попарно, между какими именно замерами разница (с поправкой на число сравнений).
Пример с расчётом и диаграммой
Соберём всё вместе. Группа из 20 бегунов, дистанция 100 м, замеры до и после программы. Меньшее время — лучше. Результаты сравнения по Вилкоксону представлены в таблице 1.
Таблица 1 — Динамика результата в беге на 100 м до и после программы по критерию Вилкоксона (n = 20)
| Показатель | Me до, с | Me после, с | Прирост | T эмп | T крит (p ≤ 0,05) | Вывод |
|---|---|---|---|---|---|---|
| Время на 100 м | 14,8 | 14,2 | −0,6 с (−4 %) | 31 | 52 | сдвиг значим (p < 0,05) |
После таблицы — вывод словами: «Время на дистанции 100 м после программы значимо снизилось: медиана упала с 14,8 до 14,2 с (T = 31 < T₍₀,₀₅₎ = 52; p < 0,05)». Для Вилкоксона помните правило: значимость есть, когда T эмпирическое меньше или равно T критическому — это противоположно тому, как сравнивают у Стьюдента.
Наглядно динамику показывает рисунок 1. Обратите внимание: столбик «после» ниже, и для бега это хорошо — времени стало меньше.
Что писать в дипломе
Готовые формулировки — подставьте свои числа.
Когда сдвиг значим:
- «Результат в беге на 100 м после реализации программы статистически значимо улучшился: медиана времени снизилась с 14,8 до 14,2 с (критерий Вилкоксона, T = 31, p < 0,05)».
- «По критерию Фридмана выявлена значимая динамика силы хвата на трёх этапах подготовки (χ² = 12,4; p < 0,05)».
Когда сдвига нет:
- «Статистически значимых изменений дальности броска не выявлено (T = 58; p = 0,21), что может быть связано с малым объёмом выборки».
К критерию обязательно добавьте размер прироста: средние или медианы «до» и «после» и разницу в единицах или процентах.
Рабочая связка для спортивного диплома: медиана до → медиана после → прирост в единицах/процентах → критерий с T (или χ²) и p. Эти четыре элемента превращают «вроде стало лучше» в доказанный факт.
Частые ошибки
- Перепутать направление в беге и плавании. Меньшее время — лучше. Снижение секунд — это рост результата, а не падение.
- Делать вывод по одному среднему. «Среднее улучшилось» без критерия и p — не доказательство.
- Сравнивать три замера Вилкоксоном попарно. Для трёх и более точек нужен Фридман, иначе завысите значимость.
- Брать Вилкоксона для двух разных групп. Он для одних и тех же спортсменов дважды. Для контрольной и экспериментальной групп — Манна-Уитни.
- Забыть про размер прироста. Значимость без величины эффекта оставляет работу неполной.
Частые вопросы
У меня контрольная и экспериментальная группа — тоже Вилкоксон?
Нет. Вилкоксон сравнивает один и тот же состав до и после. Две разные группы людей сравнивают критерием Манна-Уитни. Часто в дипломе нужно и то, и другое: Манна-Уитни — чтобы показать, что группы на старте были равны, и Вилкоксон — чтобы показать сдвиг внутри каждой.
Сколько спортсменов нужно для расчёта?
Вилкоксон формально работает от ~6 пар, но чем больше, тем надёжнее. Для спортивных работ обычно берут 12–30 человек. Подробнее — в статье «Сколько респондентов нужно для диплома».
А если у двух спортсменов результат не изменился?
Пары с нулевым сдвигом (до = после) из расчёта Вилкоксона обычно исключаются, и объём выборки для критерия слегка уменьшается. Это нормально, просто отметьте это в работе.
Чем меньше p, тем сильнее эффект?
Нет. P говорит только о том, что сдвиг не случаен, но не о его величине. Сильный эффект показывает размер прироста (секунды, метры, проценты), а не маленькое p. О величине эффекта — статья «Размер эффекта d Коэна».
Нужно ли проверять нормальность перед Вилкоксоном?
Нет — это его плюс. Нормальность нужна параметрическим методам (Стьюдент). Вилкоксон и Фридман непараметрические и работают без этого условия. О разнице — статья «Параметрические и непараметрические критерии».
Короткий алгоритм
- Определите тип сравнения. Одни и те же спортсмены до/после? Тогда связанные выборки.
- Считайте замеры. Два замера → Вилкоксон. Три и больше → Фридман.
- Помните направление. В беге/плавании меньшее время — лучше.
- Получите p. p < 0,05 — сдвиг значим; p > 0,05 — нет.
- Добавьте прирост. Медианы «до» и «после» плюс разница в единицах или процентах.
- Опишите словами. Критерий, его статистику (T или χ²), n и p — в текст диплома.
Что ещё почитать
- Эффективность тренировки: как доказать статистикой — соседняя тема про сравнение программ.
- Руководство по критерию Вилкоксона — пошагово, с расчётом вручную.
- Руководство по критерию Фридмана — для нескольких замеров.
- Обработка функциональных проб в дипломе — если меряете пробы Штанге, Генчи и т. п.
- Как описать результаты статистики — чтобы грамотно изложить выводы.
Не уверены, какой критерий взять для вашего эксперимента — загляните в базу методов или закажите консультацию: эксперт подберёт метод и посчитает за вас.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию