Procesamiento del lenguaje natural

Qué es y por qué es importante

 

El procesamiento del lenguaje natural (NLP, por sus siglas en inglés) es una rama de la inteligencia artificial que ayuda a las computadoras a entender, interpretar y manipular el lenguaje humano. NLP toma elementos prestados de muchas disciplinas, incluyendo la ciencia de la computación y la lingüística computacional, en su afán por cerrar la brecha entre la comunicación humana y el entendimiento de las computadoras.

 

Evolución del procesamiento del lenguaje natural

Aunque el procesamiento del lenguaje natural no es una ciencia nueva, la tecnología avanza con rapidez gracias a un mayor interés en la comunicación entre humanos y máquinas, además de la disponibilidad del big data, computadoras poderosas y algoritmos mejorados. 

Como humano, usted puede hablar y escribir en inglés, español o chino. Pero el lenguaje nativo de una computadora – que se conoce como código o lenguaje de máquina – es mayormente incomprensible to para la mayoría de las personas. En los niveles más bajos de su dispositivo, la comunicación se da no con palabras sino a través de millones de ceros y unos que producen acciones lógicas. 

De hecho, los programadores utilizaban tarjetas perforadas para comunicarse con las primeras computadoras hace 70 años. Este proceso manual y arduo era entendido por un número relativamente reducido de personas. Ahora puede decir, “Alexa, me gusta esta canción” y un dispositivo que reproduce música en su hogar bajará el volumen y le responderá, “OK. Evaluación guardada”, en una voz similar a la humana. Luego adapta su algoritmo para reproducir esa canción – y otras como ésa – la próxima vez que escuche esa estación musical. 

Demos un vistazo más de cerca a esa interacción. Su dispositivo se activó cuando lo oyó hablar, entendió la intención no hablada en el comentario, ejecutó una acción y proporcionó retroalimentación en un enunciado bien estructurado en inglés (o español), todo en un espacio de unos cinco segundos. La interacción completa la hizo posible el procesamiento del lenguaje natural, junto con otros elementos de inteligencia artificial como el aprendizaje basado en máquina y el aprendizaje a fondo. 

 

Reducción de las quejas de clientes con NLP

Royal Bank of Scotland utiliza analítica de texto, técnica NLP, para extraer tendencias importantes de la retroalimentación de clientes en muchas formas. La compañía analiza datos de correos electrónicos, encuestas y conversaciones con centros de atención a clientes para identificar la causa de origen de la insatisfacción de los clientes e implementar mejoras. Vea el video para aprender más acerca de la analítica que transforma las relaciones con clientes.

 

¿Por qué es importante el procesamiento del lenguaje natural?

Grandes volúmenes de datos textuales

El procesamiento del lenguaje natural ayuda a las computadoras a comunicarse con humanos en su lenguaje y escala otras tareas relacionadas con el lenguaje. Por ejemplo, NLP hace posible que las computadoras lean texto, escuchen la voz hablada, la interpreten, midan el sentimiento y determinen qué partes son importantes. 

Las máquinas de hoy pueden analizar más datos basados en lenguajes que los humanos, sin fatigarse y de una forma consistente e imparcial. Considerando la asombrosa cantidad de datos no estructurados que se generan todos los días, desde registros médicos hasta medios sociales, la automatización será decisiva para analizar por completo datos de texto y habla con eficiencia.

Estructuración de una fuente de datos altamente no estructurada

El lenguaje humano es increíblemente complejo y diverso. Nos expresamos de maneras infinitas, verbalmente y por escrito. No sólo existen cientos de lenguajes y dialectos, pero en cada lenguaje existe un conjunto único de reglas gramáticas y de sintaxis, términos y palabras coloquiales. Cuando escribimos, a menudo cometemos errores ortográficos o abreviamos palabras, o bien omitimos signos de puntuación. Cuando hablamos, tenemos acentos regionales, y mascullamos, tartamudeamos o tomamos palabras prestadas de otros idiomas. 

Aunque el aprendizaje supervisado y no supervisado, y específicamente el aprendizaje a fondo, se utilizan ahora ampliamente para modelar el lenguaje humano, se necesitan también entendimiento sintáctico y semántico, y conocimientos de dominio que no están necesariamente presentes en estos métodos de machine learning. NLP es importante porque ayuda a resolver la ambigüedad del lenguaje y agrega estructura numérica útil a los datos para muchas aplicaciones industriales, como el reconocimiento del habla o la analítica de texto. 

NLP en el mundo actual

Aprenda más acerca del procesamiento del lenguaje natural en muchas industrias

Planeación para NLP

¿Cómo utilizan organizaciones de todo el mundo la inteligencia artificial y el procesamiento del lenguaje natural? ¿Cuáles son los índices de adopción y los planes a futuro para estas tecnologías? ¿Cuáles son los presupuestos y los planes de implementación? ¿Y qué problemas de negocios se resuelven con algoritmos NLP? Descúbralo en este reporte de TDWI.

Detecte la septicemia antes de que se vuelva mortal

Dignity Health utiliza NLP y otros algoritmos avanzados para monitorear registros médicos electrónicos para detectar indicios de septicemia. Si la probabilidad de que un paciente presente septicemia es alta, el sistema envía una alarma a la enfermera o médico de guardia.

¿Qué puede hacer la analítica de texto por su organización?

La analítica de texto es un tipo de procesamiento del lenguaje natural que convierte el texto en datos para su análisis. Aprenda cómo organizaciones de la banca, atención a la salud y ciencias de la vida, manufactura y gobierno utilizan la analítica de texto para ofrecer mejores experiencias a sus clientes, reducir el fraude y mejorar la convivencia social.

¿Cómo funciona NLP?

Separación de las piezas elementales del lenguaje

El procesamiento del lenguaje natural incluye diferentes técnicas para interpretar el lenguaje humano, que van desde los métodos estadísticos y del aprendizaje basado en máquina hasta los enfoques basados en reglas y algorítmicos. Necesitamos una amplia variedad de métodos porque los datos basados en texto y en voz varían ampliamente, al igual que las aplicaciones prácticas. 

Las tareas básicas de NLP incluyen la simbolización y el análisis sintáctico , lematización/derivación, etiquetado de la parte del habla, detección del lenguaje e identificación de relaciones semánticas. Si alguna vez creó diagramas de enunciados en la primaria, ya ha realizado estas tareas de forma manual antes. 

En términos generales, las tareas NLP dividen el lenguaje en piezas elementales más cortas, intentan entender las relaciones entre las piezas y exploran cómo funcionan las piezas juntas para crear significado.

Estas tareas implícitas se utilizan a menudo en recursos NLP de más alto nivel, como:

  • Categorización de contenido. Un resumen del documento basado en la lingüística, incluyendo búsqueda e indización, alertas de contenido y detección de duplicación.
  • Descubrimiento y modelado de temas. Capture con precisión el significado y temas en colecciones de texto, y aplique analítica avanzada a texto, como optimización y pronósticos.
  • Extracción contextual. Extraiga automáticamente información estructurada de fuentes basadas en texto.
  • Análisis de sentimiento. Identificación del estado de ánimo u opiniones subjetivas en grandes cantidades de texto, incluyendo minería de sentimiento y opiniones promedio. 
  • Conversión de habla a texto y de texto a habla. Transformación de comandos de voz en texto escrito y viceversa. 
  • Sumarización de documentos. Generación automática de sinopsis de grandes cuerpos de texto.
  • Traducción basada en máquina. Traducción automática de texto o habla de un idioma a otro.


En todos estos casos, la meta general es tomar texto crudo del lenguaje y aplicar la lingüística y algoritmos para transformar o enriquecer el texto de tal forma que provea un mayor valor. 

Métodos y aplicaciones NLP

Cómo entienden las computadoras los datos textuales

NLP y analítica de texto

El procesamiento del lenguaje natural va de la mano de la analítica de texto, la cual cuenta, agrupa y categoriza palabras para extraer estructura y significado de grandes volúmenes de contenido. La analítica de texto se utiliza para explorar contenido textual y derivar nuevas variables de texto crudo que se pueden visualizar, filtrar o utilizar como entradas para modelos predictivos u otros métodos estadísticos.

NLP y la analítica de texto se utilizan juntos para muchas aplicaciones, entre otras:

  • Descubrimiento de investigación. Identifique patrones y pistas en correos electrónicos o reportes escritos para detectar y resolver delitos.
  • Conocimiento en materia. Clasifique contenido en temas significativos de modo que pueda seguir alguna acción y descubrir tendencias.
  • Analítica de medios sociales. Descubra conocimiento y sentimiento sobre temas específicos e identifique a personas influyentes importantes. 

Ejemplos cotidianos de NLP 

Existen muchas aplicaciones comunes y prácticas de NLP en nuestras vidas diarias. Más allá de conversar con asistentes visuales como Alexa o Siri, he aquí algunos ejemplos más: 

  • ¿Alguna vez ha observado los correos electrónicos de su carpeta de correo no deseado y ha notado similitudes en las líneas del asunto? Observa filtrado de correo no deseado Bayesiano, técnica NLP estadística que compara las palabras del correo no deseado con correos electrónicos válidos para identificar correo basura.
  • ¿Alguna vez ha perdido una llamada telefónica y leído la transcripción automática del correo de voz en su bandeja de entrada del correo o aplicación de su teléfono inteligente? Eso es conversión de habla a texto, recurso del procesamiento del lenguaje natural.
  • ¿Alguna vez ha navegado por un sitio Web utilizando su barra de búsqueda integrada o bien seleccionando etiquetas sugeridas de tema, entidad o categoría? Entonces ha empleado métodos NLP para realizar búsquedas, modelado de remas, extracción de entidades y categorización de contenido.

Un subcampo de NLP llamado entendimiento del lenguaje natural (NLU, por sus siglas en inglés) ha comenzado a crecer en popularidad debido a su potencial en aplicaciones cognitivas y de inteligencia artificial. NLU va más allá del entendimiento estructural del lenguaje para interpretar intención, resolver ambigüedad de contexto y palabras, e incluso generar lenguaje humano bien formado por cuenta propia. Los algoritmos NLU deben resolver el problema muy complejo de la interpretación semántica – es decir, entender el significado pretendido del lenguaje hablado o escrito, con todas las sutilezas, contenido e inferencias que los humanos podemos comprender.

La evolución de NLP hacia NLU tiene muchas implicaciones importantes para empresas y consumidores por igual. Imagine el poder de un algoritmo que puede entender el significado y el matiz del lenguaje humano en muchos contextos, desde medicina hasta leyes y hasta el salón de clases. A medida que los volúmenes de información no estructurada continúen creciendo de manera exponencial, nos beneficiaremos de la habilidad incansable de las computadoras de ayudarnos a comprenderlo todo. 

Qué puede leer después