Minería de datos

Qué es y por qué es importante

La minería de datos es el proceso de hallar anomalías, patrones y correlaciones en grandes conjuntos de datos para predecir resultados. Empleando una amplia variedad de técnicas, puede utilizar esta información para incrementar sus ingresos, recortar costos, mejorar sus relaciones con clientes, reducir riesgos y más.

Historia de la minería de datos y avances actuales

El proceso de escarbar en los datos para descubrir conexiones ocultas y predecir tendencias futuras tiene una larga historia. A veces denominado "knowledge discovery in databases," el término "data mining" no se acuñó hasta la década de 1990. Pero sus cimientos comprenden tres disciplinas científicas entrelazadas: la estadística (el estudio numérico de las relaciones entre datos), la inteligencia artificial (inteligencia similar a la humana desplegada por programas informáticos y/o máquinas) y el aprendizaje automático (algoritmos que pueden aprender de los datos para hacer predicciones). Lo que era viejo vuelve a ser nuevo, ya que la tecnología de extracción de datos sigue evolucionando para adaptarse al potencial ilimitado de los macrodatos y a una potencia informática asequible.

En la última década, los avances en potencia y velocidad de procesamiento nos han permitido pasar de las prácticas manuales, tediosas y lentas al análisis de datos rápido, sencillo y automatizado. Cuanto más complejos sean los conjuntos de datos recopilados, mayor será el potencial para descubrir información relevante. Retailers, bancos, manufactureras, proveedores de telecomunicaciones y aseguradoras, entre otros, están utilizando la minería de datos para descubrir relaciones entre todos los elementos, desde la optimización de precios, las promociones y los datos demográficos hasta el modo en que la economía, el riesgo, la competencia y las redes sociales afectan a sus modelos de negocio, ingresos, operaciones y relaciones con los clientes.

 

¿Por qué es importante la minería de datos?

¿Entonces por qué es importante la minería de datos? Ha podido apreciar los números asombrosos – el volumen de datos producidos se duplica cada dos años. Los datos no estructurados por sí solos conforman el 90% del universo digital. Pero más información no significa necesariamente más conocimientos.

La minería de datos le permite:

  • Filtrar todo el ruido caótico y repetitivo en sus datos.
  • Entender qué es relevante y luego hacer un buen uso de esa información para evaluar resultados probables.
  • Acelerar el ritmo de la toma de decisiones informadas.

Obtenga más información sobre las técnicas de minería de datos en Data Mining From A to Z, un documento que muestra cómo las organizaciones pueden utilizar analítica predictiva y la minería de datos para revelar nuevos insights a partir de los datos. 

Minería de datos en el mundo actual

La minería de datos es la piedra angular de la analítica, ya que le ayuda a desarrollar modelos capaces de descubrir conexiones entre millones o miles de millones de registros. Descubra cómo la minería de datos está dando forma al mundo en que vivimos.

Desmitificación de la minería de datos en las operaciones de petróleo & gas

Explore cómo se utilizan la minería de datos – y también los modelos predictivos y la analítica en tiempo real – en las operaciones de petróleo y gas. Este documento explora enfoques prácticos, flujos de trabajo y técnicas empleadas.

Lea el resumen

La intersección de big data y minería de datos

El experto en minería de datos Jared Dean escribió el libro sobre minería de datos. Explica cómo maximizar su programa de análisis utilizando la informática de alto rendimiento y los análisis avanzados.

Lea el resumen

 

Data mining software

Data mining software from SAS uses proven, cutting-edge algorithms designed to help you solve the biggest challenges.

Learn more about data mining software from SAS

¿Quién lo utiliza?

La minería de datos se sitúa en el corazón de esfuerzos analíticos en diversas industrias y disciplinas.

Telecomunicaciones, medios de comunicación & Tecnología

En un mercado saturado en el que la competencia es feroz, las respuestas suelen estar en los datos de los consumidores. Las empresas de telecomunicaciones, medios de comunicación y tecnología pueden utilizar modelos analíticos para dar sentido a montañas de datos de clientes, ayudándoles a predecir su comportamiento y ofrecer campañas muy específicas y pertinentes.

Seguros

Gracias a los conocimientos analíticos, las aseguradoras pueden resolver problemas complejos relacionados con el fraude, el cumplimiento, la gestión de riesgos y la pérdida de clientes. Las empresas han utilizado técnicas de minería de datos para fijar el precio de los productos de forma más eficaz en todas las líneas de negocio y encontrar nuevas formas de ofrecer productos competitivos a su base de clientes actual.

Educación

Con vistas unificadas basadas en datos del progreso de los estudiantes, los educadores pueden predecir el desempeño de sus alumnos antes de que pongan un pie en el salón de clases – y desarrollar estrategias de intervención para mantenerlos en curso. La minería de datos ayuda a los educadores a acceder a datos de los estudiantes, a predecir niveles de logro y a detectar estudiantes o grupos de estudiantes que necesitan atención extra.

Manufactura

Alinear los planes de suministro con las previsiones de demanda es esencial, como también lo es la detección precoz de problemas, la garantía de calidad y la inversión en valor de marca. Los manufactureros pueden predecir el desgaste de los activos de producción y anticipar el mantenimiento, lo que puede maximizar el tiempo de actividad y mantener la línea de producción dentro de los plazos previstos.

Bancos

Los algoritmos automatizados ayudan a los bancos a comprender su base de clientes, así como los miles de millones de transacciones que constituyen el núcleo del sistema financiero. La minería de datos ayuda a las empresas de servicios financieros a tener una mejor visión de los riesgos del mercado, detectar el fraude con mayor rapidez, gestionar las obligaciones de cumplimiento de la normativa y obtener un rendimiento óptimo de sus inversiones en marketing.

Retail

Las grandes bases de datos de clientes contienen información oculta sobre ellos que puede ayudarle a mejorar las relaciones, optimizar las campañas de marketing y prever las ventas. Gracias a modelos de datos más precisos, las empresas minoristas pueden ofrecer campañas más específicas y encontrar la oferta que más impacto tenga en el cliente.

 

Data mining software

SAS data mining software uses proven, cutting-edge algorithms designed to help you solve your biggest challenges.

Learn more about data mining software from SAS

Cómo funciona

La minería de datos, como una disciplina compuesta, representa diversos métodos o técnicas que se utilizan en diferentes capacidades analíticas que abordan una gama de necesidades organizacionales, hacen diferentes tipos de preguntas y utilizan diferentes niveles de aportación humana o reglas para llegar a una decisión.

 

Modelado descriptivo: Descubre similitudes o agrupaciones compartidas en datos históricos para determinar razones detrás del éxito o el fracaso, como la clasificación de clientes por preferencias de productos o sentimiento. Algunas técnicas de ejemplo incluyen:

Agrupación en clústeres
Agrupación de registros similares.
Detección de anomalías
Identificación de valores atípicos multidimensionales.
Aprendizaje de reglas de asociación
Detección de relaciones entre registros.
Análisis de componentes principales
Detección de relaciones entre variables.
Agrupación por afinidad
Agrupación de personas con intereses comunes o metas similares (por ejemplo, personas que compran X a menudo compran Y y posiblemente Z).

 

Modelización predictiva: Este modelado profundiza en la clasificación de eventos en el futuro o la estimación de resultados desconocidos; por ejemplo, el uso de la calificación crediticia para determinar la probabilidad de que una persona devuelva un préstamo. Los modelos predictivos también ayudan a descubrir aspectos como la pérdida de clientes, la respuesta a las campañas o los impagos. Entre las técnicas de muestra se incluyen:

Regresión
Medida de la solidez de la relación entre una variable dependiente y una serie de variables independientes.
Redes neurales
Programas de computadora que detectan patrones, hacen predicciones y aprenden.
Árboles de decisión
Diagramas en forma de árbol en los que cada rama representa una incidencia probable.
Máquinas vectoriales de soporte
Modelos de aprendizaje supervisado con algoritmos de aprendizaje asociados.


Modelado prescriptivo
: Con el incremento de los datos no estructurados de la Web, campos de comentarios, libros, correo electrónico, PDFs, audio y otras fuentes de texto, la adopción de la minería de texto como disciplina relacionada con la minería de datos también ha crecido de manera considerable. Necesita la posibilidad de analizar, filtrar y transformar con éxito datos no estructurados para incluirlos en modelos predictivos para mejorar la precisión de las predicciones.

Al final, no debe ver la minería de datos como una entidad independiente porque el preprocesamiento (preparación y exploración de datos) y el posprocesamiento (validación de modelos, calificación y monitoreo del desempeño de modelos) son igualmente esenciales. El modelado prescriptivo se centra en variables y restricciones internas y externas para recomendar uno o más cursos de acción – por ejemplo, determinar la mejor oferta de marketing para enviar a cada cliente. Algunas técnicas de ejemplo incluyen:

Analítica predictiva más reglas
Creación de reglas qué pasaría si/entonces a partir de patrones y predicción de resultados.
Optimización del marketing
Simulación de la mezcla de medios más ventajosa en tiempo real para lograr el más alto ROI posible.