HR-АНАЛИТИКА
DEYNEKINA HR&BA

Что лучше использовать при анализе данных:
среднее или медиану?

Когда HR-ы хотят перейти на другой уровень аналитики, после метрик они интересуются статистическими методами анализа данных. С чего начать, если статистика прошла мимо в институте? Давайте разбираться.
Сегодня разберем два понятия «среднее» и «медиана».

Для начала задам два вопроса: знакомы ли вы с понятием «медиана»? Знаете ли вы, в чем разница между средним и медианой? Скорее всего, если вы работаете с обзорами по рынку зарплат, вы встречали понятие медианы и чаще всего именно на этом ее применение и заканчивалось. Но я рекомендую использовать медиану и в других случаях.

Среднее – это самый популярный статистический показатель, который используется для измерения центра или середины данных. Среднее значение считается как сумма всех чисел, деленная на общее количество чисел. Это материал где-то пятого класса, поэтому тут пока все просто. Среднее значение в компаниях считают для стажа, возраста сотрудников, зарплаты по грейду, уровню должности, для подачи отчетности по статистическим данным. Считается с помощью функции в Excel: СРЗНАЧ или AVERAGE в английской версии.

Минусы среднего показателя:
Среднее значение может быть не совсем объективным отражением данных, так как на него могут влиять выбросы (очень большие или очень маленькие значения в наборе данных).

Если вы считаете средний стаж работы сотрудников в компании при большой текучести, стаж до трех месяцев работы сотрудников будет занижать данные. Или наоборот, у вас есть сотрудники-старожилы, которые работают с основания компании. При учете их продолжительности стажа вы будете завышать данные, что тоже искажает отчетность.

Пример: рассчитать средний стаж работы сотрудников.

Средний стаж составит 4 года.

Медиана – значение, которое делит отсортированные по возрастанию данных на две равные части. То есть медиана показывает середину ваших данных. Медиана считается как значение, расположенное по середине ряда отсортированных значений. Если в ряду находится нечетное количество данных, например, 5, то медианой будет третье значение. Если четное количество данных, например, 4, то медианой будет (значение 2+ значение 3)/2. То есть среднее значение двух показателей посередине.

Считается с помощью функции в Excel МЕДИАНА или MEDIAN в английской версии. Медиана лишена недостатков среднего значения, на нее не влияют выбросы.

Пример:
Медиана стажа составит 3 года. Разница между 3 и 4 годами стажа работы все-таки есть.
РЕКОМЕНДАЦИЯ:
Если нужно посчитать стаж, возраст, зарплату, считайте не среднее, а медиану. Ну или убирайте выбросы. Как? Узнаете в этой статье.

Если вы хотите со мной пройти путь познания статистики и применения ее в работе, приглашаю на онлайн-курс «HR-аналитика: начальный уровень».