Неиспользованный потенциал в неструктурированном тексте
Мэри Бет Мур , стратегический специалист по ИИ и языковой аналитике, SAS
Вы когда-нибудь наблюдали сверху за оживленными улицами? Или за тем, как люди «общаются» в переполненных кофейнях? В наши дни невозможно не заметить, как все постоянно что-то строчат в своих телефонах, планшетах и ноутбуках.
Наблюдая за людьми, поглощенными собственными устройствами, я представляю, как набираются символы (разговорные сокращения, аббревиатуры, смайлики) и используется автозамена.
Это процесс переноса мыслей в цифровой мир. Наши исследования, мнения, факты, отзывы и призывы к действию преобразуются из человеческого языка в данные через клавиатуру. Но что мы делаем со всеми этими данными?
Неструктурированный текст - крупнейший источник данных, созданный человеком, и этот источник с каждым днем увеличивается в геометрической прогрессии. Текст произвольной формы, который мы печатаем на клавиатуре или мобильном устройстве, является важным средством передачи наших мыслей и способом фиксирования нашей деятельности. Тем не менее, многие компании не используют потенциал своих неструктурированных текстовых данных, будь то внутренние отчеты, взаимодействия с клиентами, журналы обслуживания или другие деловые файлы. Таким образом лица, принимающие решения, упускают возможность принять действенные меры в отношении существующих и возникающих проблем.
Бесплатный документ
В документе «Текстовая аналитика для руководителей» исследуется, как текстовая аналитика используется во многих отраслях, включая банковское дело, производство и правительство. Неструктурированные данные - это огромный и, в основном, неиспользованный источник для совершенствования и инноваций.
Революционный подход с использованием обработки естественного языка
Обработка естественного языка (NLP) - это область искусственного интеллекта (ИИ), которая помогает компьютерам понимать, интерпретировать и манипулировать человеческим языком. В общем смысле, в задачи NLP входит разделение текста или речи на элементарные частицы. - Например, в медицинских учреждениях постоянно растет массив данных в формате электронных медицинских записей. Так можно понять отношения между этими частицами, чтобы изучить, как они работают вместе, а затем создают смысл. Сочетание NLP , машинного обучения и человеческой экспертизы дает возможность революционизировать подход к новым и существующим проблемам.
Применения NLP невероятно разнообразны и идеально подходят практически для любой ситуации, требующей быстрого и неутомимого анализа неструктурированного текста. Например, в медицинских учреждениях постоянно растет массив данных в форме электронных медицинских карт. Человеку почти невозможно обнаружить закономерность симптомов и анализ первопричин, просматривая каждую отдельную запись. Но ИИ-система может работать круглосуточно, чтобы проанализировать результаты анализов, отчеты пациентов, перечисленные симптомы и многое другое. NLP доказала свою эффективность в прогнозировании действий и оповещении больниц, когда данные в электронных медицинских записях указывали на наличие сепсиса.
Изучите неструктурированные тексты в вашей компании, который вы собираете, и, возможно, вы откроете для себя что-то новое.
Остановка убийцы с помощью данных и NLP
По данным Sepsis Alliance, сепсис является основной причиной смерти в больницах. Ранняя диагностика и быстрое вмешательство имеют решающее значение при лечении сепсиса, но симптомы не всегда очевидны на ранних стадиях его возникновения. Показатели смертности увеличиваются на 8 % за каждый час отсрочки лечения. Человеческий глаз может не заметить корреляции между данными в медицинских записях и ранними признаками смертельного состояния при большой рабочей нагрузке и у пациентов с бессимптомным течением болезни на ранних стадиях. Но применение NLP к данным в электронных медицинских записях является основой для прогностических моделей, которые запускают системы оповещения, уведомляя врачей и медсестер о том, что пациент может нуждаться в медицинском вмешательстве. Исследования показали, что предоставление полного медицинского лечения сепсиса в первые 180 минут от начала заболевания может спасти 80 % жизней, которые в противном случае могли бы быть потеряны.
Применения NLP выходят за рамки медицины. Её можно использовать для анализа материалов судебных дел, каналов социальных сетей, журналов колл-центра, исследовательских документов, требований исполнений гарантийных обязательств и многого другого. Большая часть данных, хранящихся в организациях, представлена в виде неструктурированного текста.
Чтобы разобраться в своих неструктурированных текстах, необходимо сочетание трех возможностей:
- Обработка естественного языка. NLP выполняет лингвистический анализ, который существенно помогает машине читать текст. NLP анализирует и преобразует текст в формы для обработки и понимания текста. Это включает в себя такие методы, как токенизация, частеречная разметка, определение происхождения, распознавание именованных объектов и многое другое.
- Машинное обучение. После применения NLP к тексту машинное обучение использует выходные данные для глубинного анализа данных и алгоритмов машинного обучения, чтобы автоматизировать выявление ценной информации и описательную аналитику.
- Человеческий вклад. Когда дело касается анализа текста, человеческий вклад все еще невероятно важен. Предметная экспертиза применяется в форме лингвистических правил, чтобы помочь машине уловить сленг, обнаружить сарказм и предоставить соответствующий контекст.
Технология анализа неструктурированного текста активно учится на данных по мере их поступления, комбинируя машинное обучение с человеческим руководством, чтобы генерировать новые инсайты. Конечная цель заключается в создании и развертывании моделей текстовой аналитики для оперативного воздействия, обеспечивая понимание с помощью тематического анализа, извлечения контекста, категоризации документов и анализа тональности текста.
Обработка естественного языка позволяет улучшить жизнь и работу. Она может помочь добиться прогресса в областях, которые трудно изменить без сотрудничества между людьми и технологиями. Изучите неструктурированные тексты в вашей компании, которые вы собираете, и, возможно, вы откроете для себя что-то новое. Эти данные отражают голоса тех, для кого вы работаете, и обладают потенциалом, который поможет вам улучшить качество обслуживания и привлечь еще больше клиентов. Ваши неструктурированные текстовые данные могут рассказать вам впечатляющие истории. Вы их слушаете?
Эта статья первоначально появилась в insideBIGDATA .
Об авторе
Мэри Бет Мур - стратегический специалист по искусственному интеллекту и языковой аналитике в SAS. Она отвечает за стратегическое маркетинговое направление и руководит глобальным обменом сообщениями SAS для искусственного интеллекта и текстовой аналитики. Она часто пишет на широкий спектр технологических тем, включая инициативы ИИ, NLP и SAS Data for Good. До прихода в SAS Мур служила в Корпусе морской пехоты США и несколько лет работала аналитиком разведки и старшим инструктором в Министерстве обороны и разведки США, в основном поддерживая экспедиционные подразделения и специальные операции. Она также является пропагандистом специального образования, консультантом по правам инвалидов и сторонником интеграции в общество людей всех способностей.
Рекомендуем прочитать
- AI anxiety: Calm in the face of changeAI anxiety is no joke. Whether you fear jobs becoming obsolete, information being distorted or simply missing out, understanding AI anxiety can help you conquer it.
- Fraud detection and machine learning: What you need to knowМашинное обучение является важной частью инструментария обнаружения мошенничества. Вот что вам нужно для начала работы.
- Ситуационная осведомленность определяет нашу реакциюМногие обстоятельства требуют ситуационной осведомленности, то есть осознания того, что происходит вокруг. Пандемия COVID-19 усилила эту потребность, поскольку лидеры во всех отраслях использовали аналитику и визуализацию, чтобы получать ситуационную осведомленность в реальном времени и быстро реагировать на важные решения.
Готовы подписаться на инсайты сейчас?