Minería de datos

Qué es y por qué es importante

La minería de datos es el proceso de hallar anomalías, patrones y correlaciones en grandes conjuntos de datos para predecir resultados. Empleando una amplia variedad de técnicas, puede utilizar esta información para incrementar sus ingresos, recortar costos, mejorar sus relaciones con clientes, reducir riesgos y más.


Historia de la minería de datos

El proceso de escarbar en los datos para descubrir conexiones ocultas y predecir tendencias futuras tiene una larga historia. A veces denominado "knowledge discovery in databases," el término "data mining" no se acuñó hasta la década de 1990. Pero sus cimientos comprenden tres disciplinas científicas entrelazadas: la estadística (el estudio numérico de las relaciones entre datos), la inteligencia artificial (inteligencia similar a la humana desplegada por programas informáticos y/o máquinas) y el aprendizaje automático (algoritmos que pueden aprender de los datos para hacer predicciones). Lo que era viejo vuelve a ser nuevo, ya que la tecnología de extracción de datos sigue evolucionando para adaptarse al potencial ilimitado de los macrodatos y a una potencia informática asequible.

En la última década, los avances en el poder y la velocidad del tratamiento (datos) nos han permitido ir más allá de las prácticas manuales, tediosas y que consumen mucho tiempo al análisis de datos rápido, fácil y automatizado. Cuanto más complejo es el conjunto de datos recopilados, mayor es el potencial que hay para descubrir insights relevantes. Retailers, bancos, manufactureros, proveedores de telecomunicaciones y aseguradoras, entre otros, utilizan la minería de datos para descubrir relaciones entre todo, desde optimización de precios, promociones y demografía hasta cómo afectan la economía, el riesgo, la competencia y las redes sociales a su modelo de negocio, ingresos , operación y relaciones con clientes.

 

¿Por qué es importante la minería de datos?

¿Entonces por qué es importante la minería de datos? Ha podido apreciar los números asombrosos – el volumen de datos producidos se duplica cada dos años. Los datos no estructurados por sí solos conforman el 90% del universo digital. Pero más información no significa necesariamente más conocimientos.

La minería de datos le permite:

  • Filtrar todo el ruido caótico y repetitivo en sus datos.
  • Entender qué es relevante y luego hacer un buen uso de esa información para evaluar resultados probables.
  • Acelerar el ritmo de la toma de decisiones informadas.
  • Descubra nuevos insights a partir de los datos mediante el uso de la analítica predictiva.

Minería de datos en el mundo actual

La minería de datos es la piedra angular de la analítica, ya que le ayuda a desarrollar modelos capaces de descubrir conexiones entre millones o miles de millones de registros. Descubra cómo la minería de datos está dando forma al mundo en que vivimos.

El machine learning horizontal

Este documento técnico para científicos de datos principiantes e intermedios explora cuatro estilos principales de machine learning y cómo se utilizan. Lea sobre diferentes metodologías, cómo el machine learning y la minería de datos trabajan juntos para crear modelos, y cuándo es más eficiente usar Deep Learning. También aprenderá sobre algoritmos populares y consideraciones como la interpretabilidad y la automatización.

Las decisiones basadas en datos fomentan el bienestar y el crecimiento económico

La ciudad de Yakarta se enfrentaba a problemas de datos debido a un sistema de registros públicos heredado y a más de 50 aplicaciones de servicios en varios departamentos. Con una solución que incluía minería de datos y otras tecnologías analíticas, Jakarta estableció una plataforma digital única y una "súper aplicación" que brinda a los ciudadanos un fácil acceso a múltiples servicios gubernamentales. 

Lecciones de cambio de un profesor de minería de datos

Los extensores de atención cortos dificultan mantener la atención de los estudiantes. Cali M. Davis, profesora asistente de la Universidad de Troy, decidió experimentar cuando aprendía a construir modelos y resolver problemas con SAS Viya. Impartió dos clases: una sobre una herramienta de minería de datos más antigua y otra sobre software con dashboard de instrumentos y visualización. ¿Puedes adivinar cuál fue más popular?

 

Data mining software

Data mining software from SAS uses proven, cutting-edge algorithms designed to help you solve the biggest challenges.

Learn more about data mining software from SAS

¿Quién lo utiliza?

La minería de datos se sitúa en el corazón de esfuerzos analíticos en diversas industrias y disciplinas.

Telecomunicaciones, medios de comunicación & Tecnología

En un mercado saturado en el que la competencia es feroz, las respuestas suelen estar en los datos de los consumidores. Las empresas de telecomunicaciones, medios de comunicación y tecnología pueden utilizar modelos analíticos para dar sentido a montañas de datos de clientes, ayudándoles a predecir su comportamiento y ofrecer campañas muy específicas y pertinentes.

Seguros

Gracias a los conocimientos analíticos, las aseguradoras pueden resolver problemas complejos relacionados con el fraude, el cumplimiento, la gestión de riesgos y la pérdida de clientes. Las empresas han utilizado técnicas de minería de datos para fijar el precio de los productos de forma más eficaz en todas las líneas de negocio y encontrar nuevas formas de ofrecer productos competitivos a su base de clientes actual.

Educación

Con vistas unificadas basadas en datos del progreso de los estudiantes, los educadores pueden predecir el desempeño de sus alumnos antes de que pongan un pie en el salón de clases – y desarrollar estrategias de intervención para mantenerlos en curso. La minería de datos ayuda a los educadores a acceder a datos de los estudiantes, a predecir niveles de logro y a detectar estudiantes o grupos de estudiantes que necesitan atención extra.

Manufactura

Alinear los planes de suministro con las previsiones de demanda es esencial, como también lo es la detección precoz de problemas, la garantía de calidad y la inversión en valor de marca. Los manufactureros pueden predecir el desgaste de los activos de producción y anticipar el mantenimiento, lo que puede maximizar el tiempo de actividad y mantener la línea de producción dentro de los plazos previstos.

Banca

Los algoritmos automatizados ayudan a los bancos a comprender su base de clientes, así como los miles de millones de transacciones que constituyen el núcleo del sistema financiero. La minería de datos ayuda a las empresas de servicios financieros a tener una mejor visión de los riesgos del mercado, detectar el fraude con mayor rapidez, gestionar las obligaciones de cumplimiento de la normativa y obtener un rendimiento óptimo de sus inversiones en marketing.

Retail

Las grandes bases de datos de clientes contienen información oculta sobre ellos que puede ayudarle a mejorar las relaciones, optimizar las campañas de marketing y prever las ventas. Gracias a modelos de datos más precisos y a la analítica de marketing las empresas del retail pueden ofrecer campañas más específicas y encontrar la oferta que más impacto tenga en el cliente.

Cómo funciona

La minería de datos, como una disciplina compuesta, representa diversos métodos o técnicas que se utilizan en diferentes capacidades analíticas que abordan una gama de necesidades organizacionales, hacen diferentes tipos de preguntas y utilizan diferentes niveles de aportación humana o reglas para llegar a una decisión.

 

Modelado descriptivo: Descubre similitudes o agrupaciones compartidas en datos históricos para determinar razones detrás del éxito o el fracaso, como la clasificación de clientes por preferencias de productos o sentimiento. Entre las técnicas de muestra se incluyen:

Agrupación en clústeres
Agrupación de registros similares.
Detección de anomalías
Identificación de valores atípicos multidimensionales.
Aprendizaje de reglas de asociación
Detección de relaciones entre registros.
Análisis de componentes principales
Detección de relaciones entre variables.
Agrupación por afinidad
Agrupación de personas con intereses comunes o metas similares (por ejemplo, personas que compran X a menudo compran Y y posiblemente Z).

 

Modelado predictivo: Este modelado profundiza en la clasificación de eventos en el futuro o la estimación de resultados desconocidos; por ejemplo, el uso de la calificación crediticia para determinar la probabilidad de que una persona devuelva un préstamo. El modelado predictivo también ayuda a descubrir insights de cosas como la rotación de clientes, respuesta a campañas o coberturas por impago de créditos. Entre las técnicas de muestra se incluyen:

Regresión
Medida de la solidez de la relación entre una variable dependiente y una serie de variables independientes.
Redes neurales
Programas de computadora que detectan patrones, hacen predicciones y aprenden.
Árboles de decisión
Diagramas en forma de árbol en los que cada rama representa una incidencia probable.
Máquinas vectoriales de soporte
Modelos de aprendizaje supervisado con algoritmos de aprendizaje asociados.


Modelado prescriptivo
Con el incremento de los datos no estructurados de la Web, campos de comentarios, libros, correo electrónico, PDFs, audio y otras fuentes de texto, la adopción de la minería de texto como disciplina relacionada con la minería de datos también ha crecido de manera considerable. Necesita la posibilidad de analizar, filtrar y transformar con éxito datos no estructurados para incluirlos en modelos predictivos para mejorar la precisión de las predicciones.

Al final, no debe ver la minería de datos como una entidad independiente porque el preprocesamiento (preparación y exploración de datos) y el posprocesamiento (validación de modelos, calificación y monitoreo del desempeño de modelos) son igualmente esenciales. El modelado prescriptivo se centra en variables y restricciones internas y externas para recomendar uno o más cursos de acción – por ejemplo, determinar la mejor oferta de marketing para enviar a cada cliente. Entre las técnicas de muestra se incluyen:

Analítica predictiva más reglas
Creación de reglas qué pasaría si/entonces a partir de patrones y predicción de resultados.
Optimización del marketing
Simulación de la mezcla de medios más ventajosa en tiempo real para lograr el más alto ROI posible.