Z-критерий в статистике: определение и применение

2026-02-19 16:27

1.Определение

Z-критерий (z-test) — это параметрический статистический тест, используемый для проверки гипотез о среднем значении или доле в генеральной совокупности, основанный на стандартном нормальном распределении (Z-распределении) и применяемый при известной дисперсии генеральной совокупности или достаточно большом объеме выборки .

2.Происхождение и контекст

Метод возник в рамках математической статистики начала XX века как инструмент для проверки статистических гипотез. Z-критерий базируется на центральной предельной теореме, согласно которой распределение выборочных средних приближается к нормальному при увеличении объема выборки . В современной аналитике критерий широко применяется в контроле качества, медицинских исследованиях, A/B-тестировании и маркетинге .

3.Суть метода простыми словами

Z-критерий измеряет, насколько далеко выборочное среднее отклонилось от предполагаемого значения в единицах стандартного отклонения . Представьте линейку, которая измеряет расстояние не в сантиметрах, а в «единицах шума» . Если отклонение небольшое, его объясняют случайными причинами. Если отклонение слишком большое, вероятность случайности мала, и нулевую гипотезу отвергают.

4.Условия применения метода

Z-критерий применяется при соблюдении следующих условий :

Известная дисперсия генеральной совокупности (σ²): Это ключевое отличие от t-критерия, где дисперсия неизвестна и оценивается по выборке .
Достаточный объем выборки: Обычно требуется не менее 30 наблюдений (n ≥ 30), чтобы центральная предельная теорема гарантировала приближение распределения выборочного среднего к нормальному .
Нормальность распределения: Для малых выборок (n < 30) данные должны быть близки к нормальному распределению .
Независимость наблюдений: Все точки данных должны быть независимы друг от друга .

5.Как применяется метод: пошаговый алгоритм

Процесс проведения Z-теста включает следующие этапы :

1.Формулировка гипотез:

Нулевая гипотеза H₀: μ = μ₀ (среднее равно заданному значению).
Альтернативная гипотеза H₁: μ ≠ μ₀ (двусторонняя), μ > μ₀ или μ < μ₀ (односторонняя).

2.Выбор уровня значимости α: Обычно используется α = 0,05 (5%), что означает 5%-ный риск ошибки первого рода .

3.Сбор данных и расчет статистик: Определяются выборочное среднее (x̄), объем выборки (n) и стандартное отклонение генеральной совокупности (σ).

4.Вычисление Z-статистики: Показатель рассчитывается по формуле, показывающей расстояние от выборочного среднего до гипотетического в единицах стандартной ошибки .

5.Сравнение с критическим значением: Полученное значение Z сравнивается с табличным критическим значением (например, ±1,96 для двустороннего теста при α=0,05) .

6.Принятие решения: Если |Z| ≥ Z<sub>крит</sub>, нулевая гипотеза отвергается . Если |Z| < Z<sub>крит</sub>, оснований отвергнуть H₀ нет.

Не забудьте создать опрос онлайн на FOQUZ.ONLINE для успешного развития бизнеса

6.Формула

Для одновыборочного Z-критерия среднего используется формула :

Z = (x̄ — μ₀) / (σ / √n)

Где:

x̄ — выборочное среднее
μ₀ — гипотетическое среднее генеральной совокупности (из нулевой гипотезы)
σ — стандартное отклонение генеральной совокупности
n — объем выборки

Знаменатель (σ / √n) представляет собой стандартную ошибку среднего .

7.Примеры применения

Производственный контроль: Производитель шоколадных батончиков утверждает, что средний вес продукции составляет 100 г со стандартным отклонением 5 г. Выборка из 50 батончиков дает средний вес 102 г. Z-статистика = (102-100)/(5/√50) ≈ 2,83, что превышает критическое значение 1,96, указывая на значимое отклонение от нормы .
Оценка эффективности рекламы: Известно, что историческая конверсия сайта составляет 20% (σ = √(0,2*0,8) для доли). После запуска новой кампании 400 посетителей совершили 100 покупок (25%). Z-статистика для долей ≈ 2,5, что подтверждает статистическую значимость роста конверсии .
Медицинское исследование: Известно, что среднее систолическое давление в популяции составляет 120 мм рт. ст. со стандартным отклонением 15 мм рт. ст. Выборка из 36 пациентов, принимающих новый препарат, показывает среднее давление 115 мм рт. ст. Расчет Z-статистики позволяет оценить, действительно ли препарат снижает давление .
Контроль качества обслуживания (SLA): Компания установила норматив времени ответа на заявки — 5 минут со стандартным отклонением 1 минута. По результатам месяца среднее время ответа по 100 заявкам составило 5,3 минуты. Z-критерий покажет, является ли это отклонение статистически значимым или случайным.

8.Области применения

Контроль качества и производство: Проверка соответствия продукции заданным стандартам .
Медицина и здравоохранение: Сравнение показателей пациентов с популяционными нормами .
Маркетинг и A/B-тестирование: Оценка изменений конверсии, CTR и других метрик .
Социология и опросы: Проверка гипотез о средних значениях в больших выборках.
Финансы и экономика: Анализ доходностей и рыночных показателей.

9.Преимущества

Высокая мощность: При соблюдении условий обеспечивает надежное выявление различий.
Простота расчета: Формула интуитивно понятна и легко автоматизируется .
Четкие критерии: Критические значения стандартизированы и доступны в таблицах .
Применимость к долям: Позволяет проверять гипотезы не только о средних, но и о пропорциях .

10.Ограничения и недостатки

Требование известной дисперсии: На практике дисперсия генеральной совокупности часто неизвестна, что требует использования t-критерия .
Чувствительность к выбросам: Как и другие параметрические тесты, Z-критерий может давать искаженные результаты при наличии выбросов.
Требование к объему выборки: При малых выборках (n < 30) применение ограничено и требует нормальности распределения .
Приближенный характер: При оценке дисперсии по выборке (вместо известной σ) теряется точность, и предпочтительнее использовать t-критерий .