Будете ли вы отрицать, что у большинства компаний аналитика сделана из "спичек и желудей"? Даже если в них внедрены решения известных вендоров, идут эксперименты с нейросетями и ИТ-директор продает CEO и акционерам идею смены технологического уклада!
В то время, когда часто говорят о машинном обучении, искусственном интеллекте, речь редко переходит на ценности, создаваемые современной аналитикой для бизнеса. Только где-то вдали маячит туманная страшилка в виде тотальной безработицы из-за роботов(точно будет дешевле и лучше?), или настигает прилипчивая идея, что всем сотрудникам нужно разбираться "и в моделировании, и в статистике" (чтобы что?). Кстати, и тому, и другому с подачи Сбербанка уже учат в школе на курсе машинного обучения. Интересно, современные школьники более восприимчивы, умудрены и быстрее находят применения новым знаниям, чем мы, когда в школе изучали "Войну и мир"?

А как дела с аналитикой в настоящем, пока эти школьники не пришли занимать наши рабочие места?


Прежде всего, давайте зафиксируем четыре принятых вида аналитики по возрастанию сложности реализации и глубины результатов:

1. ОПИСАТЕЛЬНАЯ отвечает на вопрос: Что происходит(происходило)? Сколько, когда, где? Это визуализация собранных из разных источников данных. Они консолидированы, причесаны и сгруппированы. Вы регулярно получаете порции такой аналитики. Если повезет, то в виде интерактивных графиков на смартфоне, если повезло чуть меньше, то в виде витрины данных (сводной таблицы) в Excel, где доступны детальные цифры и возможно спуститься до каждого документа, если же не повезло совсем, то - это выгрузка "как и когда получилось" из информационной системы. В описательной аналитике, т.к. она подразумевает дальнейшие анализ или коммуникацию, важны форма представления, качество и полнота исходных данных.

2. ДИАГНОСТИЧЕСКАЯ поясняет происходящее, категоризирует и классифицирует явления, фокусирует внимание. Это причинно-следственный анализ, обогащенная информация, самые важные признаки явлений, выявленные аномалии и закономерности, информация, извлечённая из текстов или изображений. Когда данных мало, с этим справится и человек, если он владеет предметной областью и мастерски пользуется Excel, но когда их становится чуть больше, то без машинного обучения никак. В диагностической аналитике главное - это выводы, форма у них бывает совершенно разной: и флажок, и карта с областями, и граф, и пространство точек. Главное - чтоб выводы были содержательны и прозрачны, тогда они будут востребованы.

3. ПРЕДИКТИВНАЯ заглядывает в будущее и носит вероятностный характер. Прогнозы объемов, вероятности открытий страниц, писем, или невозврата кредита. Какую страницу показать следующей, сколько заказать, насколько отобьется промо-акция, дать деньги или нет - когда таких решений принимаются тысячи и больше, то или надо брать сопоставимое количество сотрудников, или внедрять машинное обучение. Она может не иметь вообще никакой формы представления, а работать тихо «под капотом» других решений. Хотя нет, вру, одна форма представления для предиктивной аналитики обязательна - это оценка качества, сравнение прогнозных значений с фактическими, без которого невозможно повышать качество машинного обучения.

4. ПРЕДПИСЫВАЮЩАЯ про сравнение с помощью моделирования огромного количества альтернатив и выбор оптимального обоснованного решения. Представьте сложный процесс, комплексную систему, в основе которой множество взаимосвязанных факторов, явлений. Для такой системы пространство для выбора решений не ограничено одним-двумя вариантами. Например, при ограниченном бюджете необходимо оптимизировать портфель продуктов, или подобрать оптимальную конфигурацию производственной линии, или решить, где поставить завод, или же создать прототип какого-то продукта со сложной логикой. Человек может нарисовать, проработать один случай для комплексных уникальных систем, но кроме как интуитивно (или иногда с помощью расчетов) не может предугадать, как эта система поведет себя в критических условиях, и не может утверждать, что это решение оптимально, потому что он сравнил его с тысячами альтернативных. Такое возможно с помощью имитационного моделирования и машинного обучения, и порой вырастает в автономные решения - роботы, что помогают рекрутерам искать сотрудников, а где-то и заменяют уже людей, как работы-категорийные менеджеры в Amazon, которые занимаются управлением ассортиментом, промо и ценообразованием.

Amazon - это здорово, а какая же аналитика встречается чаще всего? Т.к. эта аналитика в полной мере не реализует ничего из четырех вышеописанных видов, введем новый вид.

ПРИМИТИВНАЯ (с) аналитика - та, что хаотично сложилась и пассивно устоялась.

 

Такая аналитика избирательно правдива и ограниченно доступна. В ее основе лежит регулярный значительный объем ручной работы аналитиков, например, по сбору и подготовке данных, но самое интересное, что и ее интерпретация тоже требует значительного труда менеджеров. Поэтому у них цифры не совпадают(не проходили же они в школе машинное обучение), а доступная им аналитика сделана из "спичек и желудей", и порой все что они имеют, они разработали для себя сами.

Еще одной особенностью примитивной аналитики является гиперконцентрация реальных знаний о функционировании аналитических инструментов у одного-нескольких людей, которые их разрабатывают не документируя, не проверяя качество, не выращивая в отчуждаемый продукт. В таком случае компания попадает в плен этого примитивизма, потому что аналитики не заинтересованы в развитии функции за пределы их компетенций. 
Менеджеры в свою очередь не способны сформулировать внятный запрос на качественно новые аналитические решения, а вместо этого, чтобы обеспечить себя аналитикой, изучают "статистику", которой на самом деле должны владеть аналитики.

Конечно же, случаются исключения, когда примитивная аналитика соседствует с островками диагностической или даже предиктивной аналитики. Но будете ли вы спорить, что устойчивость любой конструкции ограничена устойчивостью ее самого слабого звена?

Возможности аналитики раскрываются полностью только тогда, когда она становится частью ценностного предложения для всех сотрудников и клиентов компании, когда корпоративная информация является ключевым бизнес-активом и частью бизнес-стратегии, в то время, когда развитие бизнес-процессов людей и непрерывное совершенствование аналитических методов не оставляют места для примитивизма.

Признайтесь себе честно, не нашли ли вы у себя симптомы аналитического примитивизма?