Z-критерий (z-test) — это параметрический статистический тест, используемый для проверки гипотез о среднем значении или доле в генеральной совокупности, основанный на стандартном нормальном распределении (Z-распределении) и применяемый при известной дисперсии генеральной совокупности или достаточно большом объеме выборки .
2.Происхождение и контекст
Метод возник в рамках математической статистики начала XX века как инструмент для проверки статистических гипотез. Z-критерий базируется на центральной предельной теореме, согласно которой распределение выборочных средних приближается к нормальному при увеличении объема выборки . В современной аналитике критерий широко применяется в контроле качества, медицинских исследованиях, A/B-тестировании и маркетинге .
3.Суть метода простыми словами
Z-критерий измеряет, насколько далеко выборочное среднее отклонилось от предполагаемого значения в единицах стандартного отклонения . Представьте линейку, которая измеряет расстояние не в сантиметрах, а в «единицах шума» . Если отклонение небольшое, его объясняют случайными причинами. Если отклонение слишком большое, вероятность случайности мала, и нулевую гипотезу отвергают.
4.Условия применения метода
Z-критерий применяется при соблюдении следующих условий :
Известная дисперсия генеральной совокупности (σ²): Это ключевое отличие от t-критерия, где дисперсия неизвестна и оценивается по выборке .
Достаточный объем выборки: Обычно требуется не менее 30 наблюдений (n ≥ 30), чтобы центральная предельная теорема гарантировала приближение распределения выборочного среднего к нормальному .
Нормальность распределения: Для малых выборок (n < 30) данные должны быть близки к нормальному распределению .
Независимость наблюдений: Все точки данных должны быть независимы друг от друга .
5.Как применяется метод: пошаговый алгоритм
Процесс проведения Z-теста включает следующие этапы :
1.Формулировка гипотез:
Нулевая гипотеза H₀: μ = μ₀ (среднее равно заданному значению).
2.Выбор уровня значимости α: Обычно используется α = 0,05 (5%), что означает 5%-ный риск ошибки первого рода .
3.Сбор данных и расчет статистик: Определяются выборочное среднее (x̄), объем выборки (n) и стандартное отклонение генеральной совокупности (σ).
4.Вычисление Z-статистики: Показатель рассчитывается по формуле, показывающей расстояние от выборочного среднего до гипотетического в единицах стандартной ошибки .
5.Сравнение с критическим значением: Полученное значение Z сравнивается с табличным критическим значением (например, ±1,96 для двустороннего теста при α=0,05) .
6.Принятие решения: Если |Z| ≥ Z<sub>крит</sub>, нулевая гипотеза отвергается . Если |Z| < Z<sub>крит</sub>, оснований отвергнуть H₀ нет.
Знаменатель (σ / √n) представляет собой стандартную ошибку среднего .
7.Примеры применения
Производственный контроль: Производитель шоколадных батончиков утверждает, что средний вес продукции составляет 100 г со стандартным отклонением 5 г. Выборка из 50 батончиков дает средний вес 102 г. Z-статистика = (102-100)/(5/√50) ≈ 2,83, что превышает критическое значение 1,96, указывая на значимое отклонение от нормы .
Оценка эффективности рекламы: Известно, что историческая конверсия сайта составляет 20% (σ = √(0,2*0,8) для доли). После запуска новой кампании 400 посетителей совершили 100 покупок (25%). Z-статистика для долей ≈ 2,5, что подтверждает статистическую значимость роста конверсии .
Медицинское исследование: Известно, что среднее систолическое давление в популяции составляет 120 мм рт. ст. со стандартным отклонением 15 мм рт. ст. Выборка из 36 пациентов, принимающих новый препарат, показывает среднее давление 115 мм рт. ст. Расчет Z-статистики позволяет оценить, действительно ли препарат снижает давление .
Контроль качества обслуживания (SLA): Компания установила норматив времени ответа на заявки — 5 минут со стандартным отклонением 1 минута. По результатам месяца среднее время ответа по 100 заявкам составило 5,3 минуты. Z-критерий покажет, является ли это отклонение статистически значимым или случайным.
8.Области применения
Контроль качества и производство: Проверка соответствия продукции заданным стандартам .
Медицина и здравоохранение: Сравнение показателей пациентов с популяционными нормами .
Маркетинг и A/B-тестирование: Оценка изменений конверсии, CTR и других метрик .
Социология и опросы: Проверка гипотез о средних значениях в больших выборках.
Финансы и экономика: Анализ доходностей и рыночных показателей.
9.Преимущества
Высокая мощность: При соблюдении условий обеспечивает надежное выявление различий.
Простота расчета: Формула интуитивно понятна и легко автоматизируется .
Четкие критерии: Критические значения стандартизированы и доступны в таблицах .
Применимость к долям: Позволяет проверять гипотезы не только о средних, но и о пропорциях .
10.Ограничения и недостатки
Требование известной дисперсии: На практике дисперсия генеральной совокупности часто неизвестна, что требует использования t-критерия .
Чувствительность к выбросам: Как и другие параметрические тесты, Z-критерий может давать искаженные результаты при наличии выбросов.
Требование к объему выборки: При малых выборках (n < 30) применение ограничено и требует нормальности распределения .
Приближенный характер: При оценке дисперсии по выборке (вместо известной σ) теряется точность, и предпочтительнее использовать t-критерий .