Коллеги путают понятия HR-аналитики и Big Data в HR. Давайте разберемся, какие данные относятся к Big Data, а какие к так называемой Small data.
В этой статье поговорим о Big Data или больших данных в HR.
Многие HR-коллеги связывают понятия HR-аналитики и Big Data в HR. Давайте разбираться, какие данные относятся к Big Data, а какие к так называемой Small data.
Big Data – это огромных объемов данные разной степени структурированности. Структурированные данные – это привычные нам таблицы с ячейками и столбиками. Неструктурированные данные – текстовые документы, изображения, фильмы, звукозаписи, физические объекты, данные датчиков и сенсоров.
Big Data обладает следующими характеристиками:
выводы чаще всего делаются путем перебора большого количества комбинаций;
анализируются данные всей совокупности, а не выборки;
для анализа применяются машинные алгоритмы;
для анализа данных не подойдут инструменты Excel;
данные проходят следующие этапы: извлечение, обзор, ограничение, нормализация, трансформация, визуализация, интерпретация и повторный анализ различными методами.
Большинство аналитических задач можно решить с помощью Small Data, так как информация о сотрудниках, хранящаяся в отчетных системах, является структурированной и позволяет преобразование в таблицы. А с этим может справиться Excel на первых порах, пока не начнет зависать и не справляться с большим количеством заполненных строк и столбцов. Для более продвинутых пользователей можно пользоваться языком программирования R или Python. По мнению коллег, кто профессионально занимается анализом данных на обоих языках, язык R имеет бОльшие возможности и обширные библиотеки.
От какой численности персонала можно задумываться о применении методов Big Data? Я бы сказала, что свыше 1000 сотрудников. То есть когда Вы говорите, что у Вас накопились данные в 1000 и даже более строк в экселе – это еще не Big Data.
Компаниям, в которых работает 1000 и менее сотрудников, нет смысла даже задумываться о Big Data. Используйте простые способы аналитики. Но даже компаниям, численность которых превышает 1000 сотрудников, можно обойтись без анализа Big Data. Не обязательно анализировать всю совокупность данных, работайте с выборками, проводите эксперименты с тестовыми группами, например, при обучении или внедрении разных схем премирования и смотрите на результаты. Big Data помогает решать задачи кластеризации, например, распределить сотрудников по категориям, кто какие льготы использует, и на основе этих данных рассчитывать бюджет на кафетерий льгот. Если Вы думаете, что Big Data поможет компании предсказать будущие показатели, Вы ошибаетесь. Прогнозы может строить аналитик на основании выявленных закономерностей, но никак не сама Big Data. Big Data не творит чудеса. Если Вы думаете, что чистить данные не нужно, Вы ошибаетесь. Иначе Вы возьмете мусор, проанализируете и получите на выходе такой же мусор. Так что качество данных всегда стоит на первом месте, будь то HR-аналитика или Big Data.
В каких HR-направлениях сейчас применяется Big Data? Чаще всего это:
рекрутмент из-за большого количества неструктурированных данных: профили в социальных сетях, фотографии, комментарии – все это дает пространство для анализа и подбора наилучших кандидатов.
анализ внутренних коммуникаций – анализ почты, телефонных разговоров, встреч в календарях, переписки в корпоративных коммуникаторах и тд.
формирование графиков работы – анализ загрузки на основании данных прошлых периодов и предложение по графикам сменности.
Нашла несколько интересных примеров применения Big Data не в HR. 1. Heineken – компания использует большие данные для планирования производства. Имея данные о текущей стадии производственного процесса, данные о состоянии оборудования, количестве товара в магазинах, а также сезонных колебаниях компания может составлять корректный план производства пива. Также компания сотрудничает с сетью Walmart с целью анализа поведения покупателей перед полками с пивом в режиме реального времени и увеличения конверсии продаж. Эта информация также помогает оценить, кто покупает их пиво, где должны быть расположены полки в магазине и когда. 2. В Disney World посетителям выдают браслет, который снабжен технологией радиочастотной идентификации. С его помощью компания получает информацию о том, где находится каждый посетитель парка, что делает и что ему нужно. В случае длинной очереди к аттракциону, добавляются дополнительные сотрудники или посетителю предлагается перейти к другому аттракциону, где в настоящий момент очередь меньше. Зачем это делается? Стоя в очереди, посетители не покупают еду или сувениры. Чтобы уменьшить время простоя, ведется слежка.
Я не говорю, что Big Data плоха, отнюдь нет. Но я считаю, что нужно понимать, что не всякая таблица зовется Big Data, ее технология намного сложнее, чем формирование сводных таблиц в Excel.