Ваш персональный data scientist
Знакомьтесь, персональный ассистент с аналитическими функциями для широкого круга пользователей
Автор: Элисон Болен (Alison Bolen), редактор SAS Insights
Моим детям очень нравится Siri — виртуальная помощница, созданная компанией Apple. Они задают ей вопросы при подготовке домашних заданий, узнают о результатах спортивных матчей и о научных экспериментах. Вопросы бывают очень разными — от тривиальных («Какие собаки тебе больше всего нравятся?») до философских («Что такое свобода воли?»). И она отвечает — по мере своих возможностей.
Я же отношусь к Siri намного практичнее. Она помогает мне искать рецепты, вводить тексты, проверять календарь и определять маршрут, пока я занята чем-то другим: веду машину, готовлю или гоняюсь за детьми.
Siri и аналогичные вспомогательные системы, например, Amazon Echo, Google Now и Cortana от Microsoft, называют персональными помощниками. Шаг за шагом они входят в наш повседневный обиход. В популярном рекламном ролике Amazon Echo показана семья, регулярно пользующаяся этим сервисом. С его помощью они создают списки покупок, сохраняют напоминания и слушают музыку.
Такие системы, функционирующие отчасти на базе технологий машинного обучения и обработки естественных языков, преобразуют устную речь в компьютерный запрос, находят ответ среди миллионов гигабайт данных и отвечают на том же языке, на котором был задан вопрос.
Следующий этап эволюции таких персональных помощников, особенно предназначенных для руководителей компаний, — это возможность получать релевантные их запросам данные из больших массивов информации (корпоративных или общедоступных, например, из социальных сетей или от государственных учреждений).
Представьте — вы нажимаете кнопку на столе или на смартфоне и спрашиваете:
- Какие будут прогнозы по продажам к концу года по нашим 10 крупнейшим регионам?
- Какими тремя прилагательными клиенты чаще всего описывают наши продукты в социальных сетях?
- Какие маркетинговые программы принесли нам наибольшую прибыль в этом квартале?
- С какими проблемами клиенты обращались к нам на этой неделе по всем каналам обратной связи?
Задачей таких систем станет предоставление доступа к аналитическим инструментам широкому кругу пользователей. Создание моделей и разработка сложных алгоритмов останутся в ведении специалистов с квалификацией data scientist, но такие компьютерные системы сделают аналитику доступнее для пользователей, не имеющих специального образования.
Уэйн Томпсон
(Wayne Thompson)
Старший Data Scientist SAS
С помощью технологий обработки естественного языка ваш персональный data scientist преобразует ваши слова в поисковый запрос, выполнит поиск во всех известных базах данных, применит к ним аналитические методы и даст ответ (а также, возможно, построит диаграмму или визуализирует ответ для дальнейшего углубленного изучения).
Речь идет о когнитивной обучающейся системе, в которой используются автоматизация и обработка вопросов и ответов на естественном языке. Машинное обучение помогает озвучить полученные результаты и понять, стоит ли уведомить пользователя о других вещах, которые явным образом не запрашивались.
После того как вы изучите первоначальные результаты, ваш персональный data scientist может дать ссылки на связанные по смыслу ответы или диаграммы, чтобы помочь вам разобраться в вопросе. Система может спросить: «Хотите ли вы узнать, что клиенты говорят в социальных сетях о ваших конкурентах?» Или, например: «Составить ли прогноз продаж на следующий год?». Эти подсказки помогут вам сформировать более полное представление о ситуации, особенно если вы не знакомы с информацией и аналитическими инструментами.
И наконец, если ваш запрос является новым или связан с запросом другого пользователя, ваш персональный data scientist может спросить: «Опубликовать ли эти результаты на портале?» Или: «Передать результаты вице-президенту по продажам?» Таким образом важная информация будет донесена и другим заинтересованным сотрудникам компании.
Как правило, специалисты data scientist проницательны и умеют обрабатывать данные, поэтому они прекрасно понимают, что именно нужно искать в наборах данных определенных типов. Задача системы персональный data scientist заключается не в замене этих профессионалов, а предоставлении обычному пользователю, не имеющему специального образования, возможности применять базовые инструменты в этой области самостоятельно.
При этом специалистам data scientist не стоит переживать, что их заменит машина. Назначение этих систем — предоставить доступ к аналитическим инструментам широкому кругу пользователей. Создание моделей и разработка сложных алгоритмов останутся в ведении специалистов data scientist, при этом подобные компьютерные системы сделают аналитику доступнее для пользователей, не имеющих специального образования.
В заключение предлагаю несколько подсказок от вашего персонального data scientist:
- Если вы не знаете, какую информацию нужно извлечь из данных, то просто задайте общую тему, например: «Меня интересует цепочка поставок». Система найдет основную информацию об этой теме и подскажет направления для дальнейшего изучения.
- Формулировка вопроса не имеет значения — система обработки естественного языка преобразует ваши слова в серию запросов, понятных для компьютера. Система машинного обучения обрабатывает запрос, возвращает результаты и проводит поиск связанных тем, которые не упоминались в запросе, но могут представлять интерес для пользователя. По сути, система угадывает ваш следующий вопрос.
- В ответ на сложный вопрос персональный data scientist может вывести ряд диаграмм или результатов, чтобы представить данные с нескольких точек зрения и дать рекомендации по их дальнейшему исследованию.
- Персональный data scientist — низкоуровневый инструмент BI для исследования данных, который обучается в процессе работы. Он применяет готовые модели машинного обучения и сопоставляет запросы пользователя с цепочкой моделей и данных. Чем больше вы взаимодействуете с системой, уточняя запросы, тем эффективнее она обучается.
О чем бы вы спросили своего персонального data scientist? И как, на ваш взгляд, такая система будет способствовать более широкому использованию аналитики в вашей отрасли?
Что прочитать дальше
- Что такое машинное обучение? Для чего его применяют в наше время? Прочитайте наш обзор про machine learning.
- Узнайте больше об обработке естественного языка в блогах SAS.