Productos y Soluciones / Text Mining

Text Mining con SAS® Text Miner

Aproveche el valor oculto de la información proveniente de fuentes de datos no estructuradas con la minería de textos.

SAS® Text Miner incorpora funciones de lingüística avanzadas a la solución principal de minería de datos de SAS® Enterprise Miner™. Complementar el análisis de datos estructurados (cuantitativos) con datos no estructurados (texto sin formato) ofrece visiones completas y conocimiento lleno de significado dentro de un entorno de modelado predictivo e integrado. La automatización de la captura manual de las fuentes de datos de texto, la incorporación de reportes interactivos detallados y la generación de algoritmos para análisis rigurosos avanzados permiten identificar tendencias futuras y actuar frente a las nuevas oportunidades de manera más eficiente y con menos riesgos.

Beneficios

  • Reduzca el tiempo de toma de decisiones mediante procesos automatizados.
  • Mejore el proceso de identificación descubriendo asociaciones y relaciones antes no detectadas.
  • Presente una visión de alto nivel de los datos con la posibilidad de desplazarse hacia frases específicas de los documentos.
  • Reconozca tendencias e identifique oportunidades de negocio

Leer más

Características

  • Acceso universal a los datos
  • Compatible con varios idiomas
  • Interfaz flexible y fácil de usar
  • Nodo de análisis sintáctico de textos (nueva característica en SAS® Text Miner 4.2)
  • Técnicas de reducción de dimensiones
  • Nodo de identificación de temas en textos (nueva característica en SAS® Text Miner 4.2)
  • Algoritmos de clustering de textos
  • Nodo de filtración de textos (nueva característica en SAS® Text Miner 4.2)
  • Visión de 360 grados de sus datos

Leer más

Screenshot

The Concept Linking window displays terms grouped by clusters


Screenshots

¿Qué hace diferente a SAS®?

  • SAS® Text Miner proporciona un portafolio completo de soluciones de modelado lingüístico y analítico para descubrir y extraer conocimiento a partir de múltiples documentos de texto. La nueva versión (4.2) incluye una función de búsqueda de alto desempeño, una mejor función de corrección ortográfica y el procesamiento de varios temas por documento.
  • Después de modificar el texto para que pueda ser ingresado en los motores de minería de datos, se identifican temas y tópicos, así como asociaciones explícitas, para que los documentos puedan ser clasificados en grupos relacionados para efectos de scoring (calificación) de los modelos de predicción.
  • El navegador de resultados interactivo de SAS® Text Miner permite a los analistas explorar conceptos y relaciones entre documentos y realizar modificaciones de forma dinámica para personalizar los análisis aún más.
  • Los resultados de SAS® Enterprise Content Categorization o SAS® Concept Creation para el módulo complementario SAS® Text Miner pueden ser integrados directamente en su minería de textos para complementar las entidades personalizadas creadas por usted.

Beneficios

  • Reduzca el tiempo de toma de decisiones mediante procesos automatizados. A través de la implementación de algoritmos inteligentes y técnicas de procesamiento de vocabulario, actividades que requieren mucho tiempo y que antes se realizaban manualmente —como la categorización, el etiquetado o la construcción de bibliotecas por tema e índices de documentos— se generan de forma automática y se ejecutan de manera consistente y eficaz.
  • Mejore el proceso de identificación descubriendo asociaciones y relaciones antes no detectadas. ¿Por qué limitar su analítica de textos a buscar términos o consultar elementos conocidos?  SAS® Text Miner proporciona un método único basado en datos para la identificación de nuevos conceptos, con una interfaz de usuario completa e interactiva que hace visibles las rutas y enlaces para el análisis de documentos a profundidad.
  • Presente una visión de alto nivel de los datos con la posibilidad de desplazarse hacia frases específicas de los documentos. SAS® Text Miner ofrece una presentación visual de todo el proceso de minería de datos con la posibilidad de desplazarse hacia detalles relevantes, ilustrando las conexiones y explorando los vínculos entre los elementos de las colecciones de documentos.
  • Reconozca tendencias e identifique oportunidades de negocio El análisis de datos como cartas de los clientes y observaciones de las líneas telefónicas de atención proporciona información valiosa acerca de la satisfacción del cliente o un conocimiento más profundo de las necesidades de servicio y producto.

Características

Acceso universal a los datos
  • Acceso a numerosas formas de datos de texto, incluyendo archivos PDF, texto ASCII extendido, HTML, formatos de Microsoft Office, hojas de cálculo, presentaciones, correo electrónico y formatos de base de datos.
  • Funciones de rastreo web, incluyendo discusiones en redes sociales como Twitter y feeds de noticias.
  • Capacidad para extraer, transformar y cargar datos de texto en un conjunto de datos SAS para minería.
Compatible con varios idiomas
  • Compatible con codificaciones Latin-1, caracteres de doble byte y UTF-8.
  • Lenguas europeas (codificación Latin-1): holandés, inglés, francés, alemán, italiano, polaco, portugués, español y sueco.
  • Idiomas orientales (compatible con caracteres de doble byte): árabe, chino, japonés, coreano.
Interfaz flexible y fácil de usar
  • La minería de textos se condensa en cuatro diferentes nodos que corresponden a tareas comunes. Estos nodos se pueden combinar de cualquier manera en función de la tarea que se va a realizar.
  • Estos nodos operan directamente con los diversos nodos de SAS® Enterprise Miner y se pueden ampliar aún más creando un algoritmo personalizado o declarando una nueva regla de negocios escrita por un usuario para el modelado predictivo, el clustering, la visualización y la presentación de reportes. Además, se pueden implementar como código de scoring (calificación) de SAS.
  • Los diagramas de flujo de procesos del análisis de minería de textos se pueden modificar, guardar y compartir con otros.
  • Presentación flexible de reportes que permite que los resultados sean publicados en un formato HTML conciso.
  • El diagrama de vinculación de conceptos muestra de manera visual la relación entre los términos.
Nodo de análisis sintáctico de textos (nueva característica en SAS® Text Miner 4.2)
  • Listas predeterminadas o personalizadas de palabras irrelevantes para eliminar términos con poco o ningún valor informativo de su análisis.
  • Corrección ortográfica automatizada.
  • Derivación para identificar palabras raíz.
  • Etiquetado gramatical con base en el contexto de las frases.
  • Extracción de grupos de sustantivos para identificar conceptos a nivel de frase tales como "inteligencia competitiva".
  • Soporte instantáneo para diversos tipos de entidades, incluyendo nombres de personas y empresas, lugares, fechas, direcciones, dimensiones y direcciones URL y de correo electrónico. Estas entidades son personalizadas para cada idioma compatible.
  • Referencias multipalabra definidas por el usuario tales como "point-and-click" (apuntar y hacer clic).
  • Listas de sinónimos predeterminadas y personalizadas por el usuario.
  • Funciones integrales que incluyen la división de palabras compuestas en subtérminos individuales.
Técnicas de reducción de dimensiones
  • Términos secuenciales que identifican automáticamente los n términos más ponderados en un documento.
  • Descomposición en valores singulares (SVD) que transforma cada documento en un subespacio n-dimensional donde cuanto más cerca están dos documentos en ese espacio, más similares son.
Nodo de identificación de temas en textos (nueva característica en SAS® Text Miner 4.2)
  • Navegador taxonómico que muestra los temas predeterminados generados automáticamente, así como los temas creados manualmente definidos por el usuario.
  • Los documentos se pueden clasificar y asignar a cero, uno o incluso muchos temas diferentes.
  • Los temas se pueden personalizar de forma interactiva en un entorno visual intuitivo y fácil de entender.
Algoritmos de clustering de textos
  • El clustering mediante algoritmos EM (Expectation-Maximization) reúne documentos en clusters discretos no cruzados usando técnicas de clustering espacial.
  • Clustering jerárquico que permite la clasificación automática de documentos en taxonomías.
  • Descripción de clusters y temas incorporando datos estructurados de los documentos originales para mejorar el análisis global.
Nodo de filtración de textos (nueva característica en SAS® Text Miner 4.2)
  • Contiene una visión concisa de los documentos y el vocabulario o todos los términos encontrados durante el análisis sintáctico.
  • Corrección ortográfica automática mediante el mapeo de palabras mal escritas en los términos que las contienen.
  • Aplicación de búsquedas similares a las hechas con Google o de cláusulas WHERE de SQL para dividir el análisis.
  • Puede diferenciar y filtrar de manera programática e interactiva términos sin importancia, mapear fácilmente abreviaturas y representar otros términos equivalentes.
Visión de 360 grados de sus datos
  • Combinación de datos de texto con minería tradicional de datos estructurados para automatizar, visualizar, clasificar e implementar los resultados de sus modelos predictivos.
  • Fácil combinación de datos cuantitativos y cualitativos con análisis de textos para mejorar las predicciones.
  • Las técnicas avanzadas como las redes neuronales, el razonamiento basado en memoria, los modelos de regresión y los árboles de decisión son extensibles a través del nodo de código de SAS® Enterprise Miner, el cual permite una mayor innovación y una implementación más rápida y con menos riesgos.
  • Las evaluaciones de desempeño correspondientes a múltiples modelos se pueden visualizar de manera paralela, ayudándole a seleccionar el mejor modelo para así implementarlo como código de scoring (calificación) para la clasificación de nuevos documentos.
  • Los resultados obtenidos con SAS® Enterprise Content Categorization pueden ser integrados directamente en su análisis de minería de textos.

Screenshots

Screenshot
The Concept Linking window displays terms grouped by clusters

The Concept Linking window displays terms groups by clusters according to their associations with each other.

Ver Screenshot

Screenshot
The Interactive Filter Viewer

The powerful search syntax of the Interactive Filter Viewer finds documents depending on words or phrases contained in them with the flexibility to subset your analysis.

Ver Screenshot

Screenshot
New capabilities include text parsing, text filtering and text topic identification

SAS Text Miner 4.2 includes three new nodes (Text Parsing, Text Filter and Text Topic). Multiple-word phrases, full-text search features and the ability to incorporate user-defined custom entities are just a few of the new capabilities.

Ver Screenshot

Screenshot
Filtering on a term ("accelerate"), with all misspellings detected automatically by SAS Text Miner

Ver Screenshot

Screenshot
View issues by document and change topic weights

Selecting an issue ("brake acceleration") highlighting one of the associated documents. Users can change topic weights or cutoffs by clicking the associated cell, and typing new values.

Ver Screenshot

Requerimientos del sistema

Supported platforms

  • AIX: Version 5.3 and Version 6.1 on POWER architectures
  • HP-UX Itanium: HP-UX 11iv2 (11.23), 11iv3 (11.31)
  • Linux for x64 (EM64T/AMD64): RHEL 4 and 5, SuSE SLES 9 and 10
  • Microsoft Windows (x86-32): Windows XP Professional, Windows Vista*, Windows Server 2003 family
  • Microsoft Windows on x64 (EM64T/AMD64): Windows XP Professional for x64, Windows Vista* for x64, Windows Server 2003 for x64
  • Solaris on SPARC: Version 9, 10
  • Solaris on x64: Version 10

*NOTE: Windows Vista Editions that are supported include Enterprise, Business and Ultimate

Supported Web browsers

  • Internet Explorer 6 on Windows XP Pro
  • Internet Explorer 7 on Windows XP Pro and Windows Vista*
  • Firefox 2.0 on Windows XP Pro, Windows Vista* and Linux x86 (SuSE and RHEL)

Middle tier required/optional software

  • SAS client and middle tier require Sun JRE 1.5

Required software

  • SAS Enterprise Miner is required and must be installed on the same machine as SAS Text Miner; or SAS Enterprise Miner for Desktop is required and must be installed on the same machine as SAS Text Miner for Desktop

Desea más información?

Para hablar con un representante de SAS de inmediato, llame al 01800 1127 727 de 9:00 a.m. a 6:00 p.m. o solicite más información online.