SUS (System Usability Scale): определение, расчет и применение
2026-02-15 13:36
1.Определение
SUS (System Usability Scale) — это надежный, проверенный инструмент для быстрой оценки субъективной удобства использования (юзабилити) продукта или системы, состоящий из стандартизированного опросника из десяти вопросов. Итоговый результат выражается в виде числа от 0 до 100, позволяющего сравнивать разные продукты или итерации дизайна между собой .
2.Происхождение и контекст
Метод был разработан Джоном Бруком (John Brooke) в 1986 году в Digital Equipment Corporation (Великобритания) для внутренних нужд компании. Изначально методика создавалась как «быстрый и грязный» (quick and dirty) инструмент для оценки юзабилити электронного офисного оборудования и не предполагала сложного статистического анализа . Несмотря на возраст, SUS остается популярным стандартом в индустрии пользовательского опыта (UX) благодаря своей надежности и гибкости .
3.Суть метода простыми словами
После взаимодействия с продуктом пользователь отвечает на 10 коротких утверждений, выражая степень своего согласия по 5-балльной шкале. Утверждения чередуют позитивные и негативные формулировки, чтобы респондент вдумывался в ответ, а не отмечал пункты автоматически . Затем ответы обрабатываются по специальной формуле, превращая их в единую оценку от 0 до 100. Эта оценка показывает общий уровень удобства системы глазами пользователя.
4.Как применяется метод
Процесс использования SUS стандартизирован и включает следующие шаги:
1.Проведение тестирования. Участник взаимодействует с продуктом или прототипом, выполняя сценарии использования .
2.Сбор данных. Сразу после завершения сессии участник заполняет анкету SUS, состоящую из 10 утверждений (например, «Я думаю, что мог бы часто использовать эту систему») .
3.Расчет индивидуального скора. Ответы кодируются и преобразуются:
Для нечетных (позитивных) вопросов: вклад = позиция на шкале минус 1.
Для четных (негативных) вопросов: вклад = 5 минус позиция на шкале.
Полученная сумма вкладов умножается на 2.5, что дает итоговый балл от 0 до 100 .
4.Анализ и агрегация. Вычисляется средний балл по всем участникам. Результаты могут быть дополнительно визуализированы для сравнения различных групп пользователей или раундов тестирования (например, с помощью тепловых карт) .
5.Сравнение с бенчмарками. Полученный средний балл сравнивается с известными эталонными значениями: средний показатель (68), низкий (ниже 50), высокий (выше 80) .
Пример расчета: Участник оценил позитивное утверждение «Я нашел систему простой в использовании» на 4. Вклад в финальный счет: 4 — 1 = 3. Негативное утверждение «Я считаю систему неоправданно сложной» оценено на 2. Вклад: 5 — 2 = 3.
Сравнение продуктов: Приложение А получило SUS 72, что выше среднего (68). Приложение Б получило SUS 45, что указывает на серьезные проблемы с юзабилити .
UX-аудит: Команда разработчиков использует SUS в двух раундах тестирования, чтобы доказать стейкхолдерам, что изменения в интерфейсе повысили удобство использования продукта (например, с 62 до 78 баллов) .
6.Области применения
Юзабилити-тестирование: Оценка программного обеспечения, веб-сайтов и мобильных приложений .
Проектирование взаимодействия (UX): Сравнение итераций дизайна и оценка прототипов.
Бенчмаркинг: Сравнение собственного продукта с конкурентами или отраслевыми стандартами .
Исследования в области человеко-компьютерного взаимодействия (HCI): Используется как зависимая переменная в экспериментах .
7.Преимущества
Надежность и валидность. Метод хорошо изучен и обладает высокими психометрическими свойствами, подтвержденными за десятилетия использования .
Простота использования. Легко применяется на малых выборках (от 5-8 участников) .
Технологическая независимость. Подходит для оценки любых типов систем (сайты, приложения, физические продукты).
Понятные результаты. Итоговый балл (0-100) легко интерпретируется и доносится до заинтересованных сторон .
8.Ограничения и недостатки
Субъективность. Метод измеряет субъективное восприятие пользователя (удовлетворенность), а не объективную эффективность или производительность (например, время выполнения задачи) .
Не диагностирует проблемы. SUS дает общую оценку, но не указывает на конкретные недостатки интерфейса и не объясняет причины низких оценок .
Требования к размеру выборки. Для точного сравнения с заданным бенчмарком (например, для подтверждения, что продукт «выше среднего») может потребоваться выборка большего размера, чем для обычного качественного тестирования