1. Определение
Медианное среднее (медиана) — это значение, которое делит упорядоченную выборку числовых данных пополам. Ровно половина значений в наборе меньше медианы, а другая половина — больше медианы.
2. Происхождение и контекст
Концепция медианы использовалась в статистике и теории вероятностей с XVIII века. Термин был введён английским учёным сэром Фрэнсисом Гальтоном в конце XIX века. Медиана является одной из трёх основных мер центральной тенденции наряду со средним арифметическим и модой.
3. Суть простыми словами
Медиана — это «серединное» значение. Чтобы её найти, нужно выстроить все числа по порядку от меньшего к большему и найти то, которое оказалось ровно посередине этого ряда. Она показывает, где находится середина данных, не обращая внимания на крайние, очень большие или очень маленькие значения.
4. Как применяется метод (расчёт)
- Упорядочивание данных: Все значения в выборке располагаются в порядке возрастания (от наименьшего к наибольшему).
- Определение объёма выборки (N): Подсчитывается общее количество значений в наборе данных.
- Определение значения: Находится значение или значения на вычисленных позициях, рассчитывается итог.
- Поиск позиции медианы:
- Если количество значений нечётное (N=5, 7, 9...), медиана — это значение, стоящее на позиции (N+1)/2 в упорядоченном ряду.
- Если количество значений чётное (N=4, 6, 8...), медиана — это среднее арифметическое двух значений, стоящих на позициях N/2 и (N/2)+1.
Не забудьте создать опрос онлайн на FOQUZ.ONLINE для успешного развития бизнеса
5. Примеры
Нечётное количество значений: Данные: [12, 7, 15, 3, 20].
- Упорядочиваем: [3, 7, 12, 15, 20].
- N=5 (нечётное). Позиция = (5+1)/2 = 3.
- Медиана = третье значение = 12.
Чётное количество значений: Данные: [50, 45, 30, 80].
- Упорядочиваем: [30, 45, 50, 80].
- N=4 (чётное). Позиции = 4/2=2 и (4/2)+1=3.
- Медиана = среднее между вторым (45) и третьим (50) значениями: (45+50)/2 = 47.5.
Сравнение со средним арифметическим: Данные о зарплатах в отделе: [45, 50, 55, 60, 1000] (тыс. руб.).
- Медиана = 55 (третье значение в ряду [45,50,55,60,1000]).
- Среднее арифметическое = (45+50+55+60+1000)/5 = 242.
- Медиана (55) лучше отражает типичную зарплату, так как не искажена одним большим значением (1000).
6. Области применения
- Статистический анализ данных.
- Социология и экономика (анализ доходов населения, цен на жильё).
- Финансы и оценка рисков.
- UX-исследования (анализ времени выполнения задач).
- Обработка данных, содержащих выбросы (аномалии).
7. Преимущества
- Робастность (устойчивость) к выбросам и экстремальным значениям в данных.
- Лучше, чем среднее арифметическое, описывает типичное значение в асимметричных распределениях.
- Проста для понимания и вычисления.
- Всегда соответствует одному из фактических значений в выборке (при нечётном N).
8. Ограничения и недостатки
- Для её вычисления требуется предварительное упорядочивание данных, что при больших объёмах сложнее, чем расчёт среднего.
- Менее информативна для строго симметричных распределений данных, где она совпадает со средним арифметическим.
- Не использует информацию о всех значениях в выборке (игнорирует величину каждого значения, учитывая только порядок).
- При малом объёме данных может плохо отражать центральную тенденцию.