Среднее, медиана и мода: чем отличаются и что выбрать
Чем отличаются среднее арифметическое, медиана и мода, как их найти и какую меру выбрать для своих данных. Разбор на примере с расчётом, таблица и FAQ.
Среднее, медиана и мода — три способа ответить на один вопрос: «какое значение в данных типичное». Но отвечают они по-разному, и для разных данных подходит разная мера.
Разберём, как каждую найти, чем они отличаются и какую выбрать, чтобы не завысить результат из-за одного выброса.
В двух словах
Это три меры центральной тенденции — «центр» ваших данных. Среднее — это сумма, делённая на количество; медиана — значение ровно посередине ряда; мода — самое частое значение.
Главное правило выбора: симметричные числовые данные → среднее; есть выбросы или скошенное/балльное распределение → медиана; категории (пол, профессия, тип) → мода.
Посчитать всё сразу — в калькуляторе описательной статистики: вводите числа и получаете среднее, медиану, моду и размах в готовой таблице.
Среднее арифметическое
Среднее (M) — сумма всех значений, делённая на их количество:
M = (сумма значений) / n
Это самая привычная мера. Если у пяти человек 4, 5, 5, 6, 10 баллов, то среднее = (4 + 5 + 5 + 6 + 10) / 5 = 30 / 5 = 6.
Среднее хорошо работает для числовых данных с симметричным (близким к нормальному) распределением — например, рост, вес, время реакции. Тогда оно действительно показывает «типичного» представителя.
Среднее чувствительно к выбросам: одно аномальное значение сильно сдвигает результат. В ряду 4, 5, 5, 6 среднее = 5. Замените 6 на 100 — и среднее подскочит до 28,5, хотя четыре из пяти человек по-прежнему около пятёрки.
Именно поэтому среднюю зарплату «по стране» критикуют: несколько миллиардеров завышают её так, что она перестаёт описывать большинство.
Медиана
Медиана (Me) — значение, которое делит упорядоченный ряд ровно пополам: половина значений меньше неё, половина больше. Это 50-й перцентиль.
Как найти:
- Упорядочьте значения по возрастанию.
- Если значений нечётное число — медиана это центральное значение.
- Если чётное — медиана это среднее двух центральных значений.
Пример. Ряд 4, 5, 5, 6, 10 уже упорядочен, значений 5 (нечётно), центральное — третье: Me = 5.
Пример с чётным n. Ряд 4, 5, 6, 8: два центральных значения 5 и 6, медиана = (5 + 6) / 2 = 5,5.
Медиана устойчива к выбросам: замените в ряду 4, 5, 5, 6, 10 десятку хоть на 1000 — медиана останется 5. Поэтому для скошенных данных, оценок и баллов она честнее среднего.
Медиану выбирают для порядковых данных (баллы, ранги, оценки по шкале), для скошенных распределений и когда в данных есть аномальные значения, которые не хочется выкидывать.
Мода
Мода (Mo) — значение, которое встречается чаще всего. В ряду 4, 5, 5, 6, 10 пятёрка встречается дважды, остальные по разу, значит Mo = 5.
У моды две особенности:
- Мод может быть несколько. Если два значения встречаются одинаково часто — распределение бимодальное (две моды). Иногда моды нет вовсе (все значения уникальны).
- Это единственная мера, применимая к номинальным данным. Среднее и медиану нельзя посчитать для категорий вроде «профессия» или «любимый цвет» — а самую частую категорию (моду) можно.
Для категориальной переменной «самый популярный ответ» — это и есть мода. Среднее арифметическое от «психолог, юрист, врач» не имеет смысла, а вот сказать «модальная профессия в выборке — психолог» вполне корректно.
Размах (для полноты)
Среднее, медиана и мода описывают центр, но ничего не говорят о разбросе. Простейшая мера разброса — размах:
Размах = max − min
Для ряда 4, 5, 5, 6, 10 размах = 10 − 4 = 6. Он показывает, в каком диапазоне «гуляют» данные, но тоже чувствителен к выбросам (зависит только от двух крайних значений).
Для серьёзного описания разброса используют стандартное отклонение и дисперсию, а размах берут как быструю прикидку «ширины» данных.
Что выбрать и когда
Сведём различия в таблицу.
Таблица 1 — Сравнение мер центральной тенденции
| Мера | Что показывает | Для каких данных | Чувствительность к выбросам |
|---|---|---|---|
| Среднее (M) | средний уровень: сумма / n | числовые, симметричные / нормальные | высокая — один выброс сильно сдвигает |
| Медиана (Me) | середину ряда (50-й перцентиль) | порядковые, скошенные, с выбросами | низкая — устойчива |
| Мода (Mo) | самое частое значение | любые, единственная для номинальных | низкая |
Короткое правило:
- Симметричные числовые данные → среднее (можно дополнить медианой).
- Есть выбросы, скошенное или порядковое (балльное) распределение → медиана.
- Категориальные данные (номинальная шкала) → мода.
При асимметрии среднее смещается в сторону длинного «хвоста». Поэтому сравнение среднего и медианы — быстрый индикатор скошенности: если они заметно расходятся, распределение несимметрично. Какая именно шкала у ваших данных — подскажет статья про шкалы измерения.
Где находятся три меры на скошенном распределении — на рисунке 1.
Разбор на примере с расчётом
Возьмём ряд баллов теста у 8 студентов: 3, 4, 5, 5, 5, 6, 7, 25. Последний результат (25) — явный выброс.
Среднее: (3 + 4 + 5 + 5 + 5 + 6 + 7 + 25) / 8 = 60 / 8 = 7,5.
Медиана: ряд упорядочен, n = 8 (чётно), два центральных значения — 4-е и 5-е, оба равны 5. Me = (5 + 5) / 2 = 5.
Мода: чаще всего встречается 5 (три раза). Mo = 5.
Размах: 25 − 3 = 22.
Теперь уберём выброс (25) и пересчитаем для оставшихся семи значений — в таблице 2.
Таблица 2 — Как один выброс влияет на меры центра (n = 8 → 7)
| Мера | С выбросом (есть 25) | Без выброса | Что произошло |
|---|---|---|---|
| Среднее | 7,5 | 5,0 | заметно завышено выбросом |
| Медиана | 5,0 | 5,0 | не изменилась |
| Мода | 5,0 | 5,0 | не изменилась |
| Размах | 22 | 4 | резко вырос из-за выброса |
Вывод: среднее «поехало» с 5,0 до 7,5 из-за единственного значения, а медиана и мода остались на месте. Для такого ряда честнее отчитываться по медиане. Это особенно важно в психологии: балльные (порядковые) данные корректнее описывать медианой, а не средним.
Если среднее заметно больше медианы (7,5 против 5,0) — в данных есть скошенность или выброс. В этом случае опирайтесь на медиану.
Частые ошибки
- Считать среднее для балльных шкал. Для оценок, рангов и баллов по шкале корректнее медиана.
- Игнорировать выбросы. Перед расчётом среднего проверьте крайние значения — один выброс может всё исказить.
- Описывать данные одной мерой центра. Добавляйте меру разброса (размах, стандартное отклонение) — без неё характеристика неполная.
- Считать среднее или медиану для номинальных данных. Для категорий есть только мода.
- Не упорядочивать ряд перед поиском медианы. Медиана берётся из отсортированного ряда, иначе результат неверный.
- Считать, что мода всегда одна. Мод может быть несколько, а может не быть вовсе.
Частые вопросы
Чем отличается среднее от медианы?
Среднее — это сумма всех значений, делённая на их количество, оно учитывает каждое число и потому чувствительно к выбросам. Медиана — значение посередине упорядоченного ряда, на неё крайние значения почти не влияют. На симметричных данных они близки; чем сильнее скошенность, тем больше расходятся.
Как найти моду, медиану и среднее?
Среднее: сложите все значения и поделите на их количество. Медиана: упорядочьте ряд и возьмите центральное значение (при чётном n — среднее двух центральных). Мода: найдите значение, которое повторяется чаще всего. Быстрее всего — через калькулятор описательной статистики.
Что такое размах и зачем он нужен?
Размах = максимум − минимум. Это самая простая мера разброса: показывает ширину диапазона данных. Он удобен для быстрой оценки, но зависит только от двух крайних значений, поэтому чувствителен к выбросам.
Какую меру выбрать для данных в дипломе?
Для нормально распределённых числовых данных — среднее (с σ). Для балльных, порядковых или ненормальных — медиану (с квартилями). Проверить форму распределения поможет статья как проверить нормальность.
Может ли мода совпадать со средним и медианой?
Да. На симметричном унимодальном распределении (например, идеально нормальном) среднее, медиана и мода совпадают в одной точке. Их расхождение — признак асимметрии.
Что делать, если значения не повторяются?
Тогда моды нет — каждое значение встречается по одному разу. Это нормально для непрерывных данных; в таком случае опирайтесь на среднее или медиану, а моду просто не приводите.
Короткий алгоритм
- Определите тип данных: числовые, порядковые (баллы) или категориальные.
- Категориальные → только мода.
- Числовые/порядковые → посчитайте среднее и медиану. Сильно расходятся → есть скошенность/выброс, берите медиану; близки и распределение симметрично → берите среднее.
- Добавьте меру разброса — размах или стандартное отклонение.
- Не считайте вручную — калькулятор выдаст всё сразу.
Что ещё почитать
- Как описать выборку в дипломе: описательная статистика — все показатели и как оформить таблицу.
- Стандартное отклонение и дисперсия — главные меры разброса.
- Нормальное распределение — когда среднее работает лучше всего.
- Как проверить нормальность распределения — чтобы выбрать между средним и медианой.
- Шкалы измерения — почему для баллов берут медиану, а не среднее.
Посчитать среднее, медиану, моду и размах за пару секунд можно в калькуляторе описательной статистики. А подобрать меры и оформить практическую часть под ключ поможет база методов и консультация эксперта.
Не хотите разбираться со статистикой сами?
Эксперт подберёт метод, посчитает и оформит таблицы по ГОСТ под вашу тему.
Заказать консультацию