Сегодня технологии искусственного интеллекта (ИИ) и машинного обучения помогают предсказывать исход событий в играх, поведение различных процессов и сред, включая поведение людей. Например компания DeepMind научила своего робота-программу играть в компьютерные игры. В HR индустрии есть примеры автоматизации на основе ИИ, где стоит задача предугадать нежелательные явления среди сотрудников в компаниях где работает более 100 сотрудников. Сейчас чтобы предсказать кому из сотрудников следует уделить пристальное внимание, с кем нужно побеседовать, а кого перевести в другой проект нужно собрать аналитику. Возможно ли обучить компьютер распознавать негативное отношение сотрудника к работе и предугадывать увольнение работника либо случаи халатности и вредительства? Автоматизированная система учета рабочего времени может помочь в данном случае?
Автоматизированная система учета рабочего времени. Машинное обучение или глубокий анализ данных?
В вкратце приведем немного теории. Технология Машинного обучения позволяет во первых обучить компьютер действовать по правилам, а во вторых действовать оптимально чтобы выигрывать. Процесс машинного обучения правилам игры выглядит примерно так: Робот просто делает много, много случайных ходов и каждый его шаг – оценивается по заданным правилам “правильных и удачных ходов”. Эти правила задает инженер алгоритмов машинного обучения. В результате формируются цепочки удачных ходов, для как можно большего количества состояний (положений игрока). Робот запоминает действия, которые в результате приводят к выигрышу. Эти цепочки являются его опытом.
Конечно в начале обучения правилам 95% ходов робота будут неверными потому что он просто случайно выбирает ход. В процессе обучения робот не думает а просто ходит. Но как только количество удачных ходов начинает увеличиваться, то робот уже в процессе обучения начинает применять ранее запомненные “удачные ходы”. Такая база данных может занимать гигабайты памяти. Накопление такой базы может занять дни и даже месяцы в зависимости от игры. По ходу обучения инженер будет многократно подправлять правила, поскольку будут возникать ситуации в которых робот повел себя неправильно и его выбор необходимо корректировать, и соответственно выполнить процесс обучения заново.
В настоящей игре робот пытается применить такие цепочки выигрышных действий в каждом его состоянии.
Полученный опыт можно сохранить на диске и использовать многократно в рабочих ситуациях. Но если правила игры и поведение других игроков немного меняются, значит некоторые прежние “удачные ходы” будут уже не такими хорошими а возможно и наоборот, будут приводить к моментальному проигрышу. Следовательно необходимо доработать правила и провести повторную тренировку робота.
Технологию Машинного обучения также можно использовать где необходимо по множеству Известных данных выполнить обобщение (получить Знание). А затем применить эти знания для того чтобы проверить набор Неизвестных данных, и классифицировать их на совпадение со Знанием . В случае StaffCounter известные данные это журналы Аудита действий сотрудников которые покинули компанию либо были уволены за халатность. Обобщение\Знания это шаблон который включает данные – а что общего было в действиях этих сотрудников? Неизвестные данные это журнал Аудита всех текущих сотрудников.
В данном случае Машинное обучение фокусируется на Предсказывании основанном на известных атрибутах, свойств полученных из журнала Аудита действий сотрудника за компьютером. В противоположность, технология Анализа Данных (Data Mining) фокусируется на обнаружении новых Атрибутов и свойств, которые были неизвестными до этого. И формируется вопрос – достаточно ли известных атрибутов и свойств из журнала Аудита автоматизированная система учета рабочего времени собрала, чтобы предсказать увольнение сотрудника? И если да, то каких атрибутов будет достаточно для Обобщения? Если нет, то какие еще ранее неизвестные атрибуты и свойства можно получить из журнала Аудита действий пользователя ПК?
Как обучить StaffCounter ставить HR-диагноз?
Вернемся к нашему вопросу. Можно ли обучить автоматизированная систему учета рабочего времени предсказать увольнение сотрудника путем анализа журнала Аудита его действий за компьютером. По умолчанию в журнал входит только время включения ПК, время доступа к рабочим программам и сайтам, продолжительность их использования, а также время пауз. Далее рассмотрим ситуацию когда сотрудник работает в компании начиная с даты Д1 и вот уже как два года начиная с даты Д2 компания им довольна. Нас интересует развитие ситуации по следующим сценариям:
1) … внезапно сотрудник подает заявление об увольнении либо вовсе не приходит на работу начиная с некоторой даты (Д3).
2) … начиная с некоторой даты компания им уже НЕ довольна, ему уделяется внимание и через некоторое время компания опять им снова довольна.
3) … начиная с некоторой даты сотрудник проявляет халатность и его действия приносят компании убытки.
По сути все сводиться к тому что необходимо обучить StaffCounter так, чтобы автоматизированная система учета рабочего времени ставила сотруднику диагноз: “Легкое недомогание” либо “Требует срочного HR вмешательства”. А для этого необходимо
a) иметь как можно больше эталонных данных для всех трех случаев для сотен сотрудников которые уволились, “вылечились” либо были уличены в халатности и уволены
б) разработать алгоритм поиска эталонных данных среди текущего потока данных всех сотрудников компании.