Machine Learning

Qué es y por qué es importante

 

¿Qué es el aprendizaje basado en máquina?

El aprendizaje basado en máquina es un ramo de la inteligencia artificial (AI) basado en dos cosas: algoritmos matemáticos y automatización. La idea es automatizar la construcción de modelos analíticos que utilizan algoritmos para “aprender” de datos de manera repetitiva. La “máquina” es en realidad un algoritmo, aprende de sus errores en pasos anteriores para producir los mejores resultados sin intervención humana. Estos modelos se pueden utilizar entonces para producir decisiones confiables y repetibles.

El aspecto iterativo del aprendizaje basado en máquina es importante porque sus modelos no se vuelven más inteligentes por sí solos. Necesitan aprender de cálculos previos para producir los mejores resultados.

Es una ciencia que no es nueva pero que está cobrando impulso ahora mismo. ¿El tan promocionado auto Google que se conduce solo? Esencia del aprendizaje basado en máquina. ¿Ofertas de recomendaciones en línea? Una aplicación del aprendizaje basado en máquina a la vida diaria. ¿Detección de fraude? Uno de los usos más obvios e importantes en nuestro mundo actual.

¿Por qué es importante?

Para la mayoría de las organizaciones, la carrera ha comenzado para extraer información valiosa de volúmenes y variedades de datos en aumento. Los datos electrónicos, y otros van en aumento a velocidades nunca antes vistas. Las opciones de almacenaje de Big Data son más accesibles que nunca ¡incluso hasta gratuitas! Y el poder de procesamiento de las computadoras nunca ha sido más barato o poderoso.

Eso significa que con los datos indicados, las tecnologías correctas y la analítica indicada es posible producir de forma rápida y automática modelos que puedan analizar datos más grandes y complejos. Y producir resultados en menos tiempo y más precisos sin intervención humana. Incluso en una escala muy grande. El resultado: predicciones de alto valor que pueden orientar mejores decisiones y acciones en tiempo real.

Una clave para esto es la construcción automatizada de modelos. El líder de pensamiento analítico Thomas H. Davenport escribió recientemente en The Wall Street Journal que con los volúmenes de datos rápidamente cambiantes y en crecimiento se necesitaban "flujos de modelado en rápido movimiento para sostener el ritmo". Y mientras que los "seres humanos pueden crear uno o dos modelos por semana en general, el aprendizaje basado en máquina puede crear miles".

Aplicaciones modernas

¿Alguna vez se ha pregunta cómo un comerciante en línea proporciona ofertas casi instantáneas de otros productos que quizá le interesen a usted? ¿O cómo las instituciones de préstamos pueden proveer respuestas casi en tiempo real a sus solicitudes de préstamos? Muchas actividades cotidianas son potenciadas por algoritmos de aprendizaje basado en máquina.

  • Detección de fraude.
  • Recomendaciones en línea.
  • Colocaciones de anuncios en tiempo real en páginas Web y dispositivos móviles.
  • Análisis de sentimiento basado en texto.
  • Evaluación de crédito y próximas mejores ofertas.
  • Predicción de fallas de equipo.
  • Nuevos modelos de precios.
  • Detección de intrusiones en redes.
  • Análisis de escritura manuscrita.
  • Filtrado de correo no solicitado (spam).

Ya no es el aprendizaje basado en máquina de su papá o de su abuelo

Hoy día, el aprendizaje basado en máquina no es como el de antaño. Aunque muchos de los algoritmos matemáticos han estado entre nosotros por largo tiempo, la capacidad de aplicar cálculos matemáticos complejos a cantidades enormes de datos, una y otra vez, cada vez a mayor velocidad, es un adelanto reciente. Almacenaje de datos más barato, procesamiento distribuido, computadoras más poderosas y las oportunidades analíticas que ellos proporcionan son todos responsables de que esté resurgiendo el interés en estos sistemas.

Analytics Insights

Información analítica relevante

Conéctese con la información relevante más reciente sobre analítica a través de artículos e investigación relacionados.

Explicación de los métodos de aprendizaje basado en máquina

Dos de los métodos de aprendizaje basado en máquina más ampliamente adoptados son el supervisado y el no supervisado.

  • El aprendizaje supervisado le permite descubrir patrones en datos que relacionan atributos con etiquetas -o el resultado histórico que el algoritmo está aprendiendo a predecir-. Por ejemplo, una pieza de equipo podría tener puntos de datos etiquetados como “F” (fallido) o “E” (en funcionamiento). El algoritmo utiliza los datos históricos para extraer patrones de atributos que se relacionen con resultados etiquetados con “E”. Ésta es la fase de aprendizaje. Luego los patrones predicen el resultado de etiquetas en datos futuros. Los modelos de aprendizaje basado en máquina se conocen como modelos de clasificación cuando la etiqueta tiene valores categóricos distintos por ejemplo “F” y “E” o “Bajo”, “Medio” o “Alto”. Los modelos de predicción son aquellos donde la etiqueta es un valor numérico, como una evaluación de crédito o el monto de un reclamo de seguros.
  • El aprendizaje no supervisado se utiliza contra datos que no tienen etiquetas históricas, de modo que la meta es explorar los datos y hallar alguna estructura en ellos. Los datos se separan en clases o áreas, de modo que pueda identificar los datos que sean similares o diferentes entre sí. Se utiliza ampliamente para realizar tareas como la agrupación en clústeres y la reducción de dimensión. Por ejemplo, para identificar segmentos de clientes con atributos similares que luego pueden ser tratados de forma similar en campañas de marketing. O bien, para hallar los atributos principales que separan los segmentos de clientes entre sí. Algunas técnicas populares incluyen mapas que se organizan por sí solos, localización del vecino más cercano y descomposición de valores singulares. Estos algoritmos se utilizan también para segmentar tópicos de texto, recomendar artículos e identificar valores atípicos de datos. 

Otro tópico que a menudo se aborda es la diferencia entre el aprendizaje basado en máquina y otros enfoques estadísticos y matemáticos como la minería de datos. Una definición simple es que mientras que el aprendizaje basado en máquina utiliza muchos de los mismos algoritmos que la minería de datos, la

diferencia principal es lo que predicen las dos disciplinas. La minería de datos descubre patrones y conocimientos previamente desconocidos. El aprendizaje basado en máquina se utiliza para reproducir patrones y conocimientos conocidos, aplicarlos a otros datos y luego aplicar eso a la toma de decisiones.

 

Did you know?

  • In machine learning, a target is called a label.
  • In statistics, a target is called a dependent variable.

 

Qué necesita para crear buenos sistemas de aprendizaje basado en máquina

  1. Capacidades de preparación de datos
  2. Algoritmos (básicos y avanzados)
  3. Automatización y procesos iterativos
  4. Escalabilidad
  5. Modelado de ensamble

 

Cómo puede ayudar SAS

Algoritmos

Las interfaces gráficas de usuario de SAS le ayudan a construir modelos de aprendizaje basado en máquina e implementar un proceso iterativo de aprendizaje basado en máquina. No tiene que ser un estadístico avanzado. Nuestra selección integral de algoritmos de aprendizaje basado en máquina puede ayudarle a obtener valor al instante de sus Big Data. Entre ellos se cuentan:

  • Redes neurales.
  • Árboles de decisión.
  • Bosques aleatorios.
  • Asociaciones y descubrimiento de secuencias.
  • Potenciación y empaquetado de gradientes.
  • Máquinas vectoriales de soporte.
  • Mapa del vecino más cercano.
  • Agrupación en clústeres k-medios.
  • Mapas con organización automática.
  • Técnicas de optimización de búsqueda local como algoritmos genéticos.
  • Maximización de las expectativas.
  • Curvas de regresión adaptable multivariadas.
  • Redes bayesianas.
  • Estimación de densidad del kernel.
  • Análisis de componentes principales.
  • Descomposición de valores singulares.
  • Modelos de mezclas gaussianos.
  • Construcción de reglas de cobertura secuencial.

Procesos

Como sabemos ahora, no son sólo los algoritmos. Recientemente, el secreto para obtener el mayor valor de sus Big Data está en parear los mejores algoritmos para la tarea en mano con:

  • Calidad y gestión de datos integrales.
  • GUIs para construir modelos y flujos de procesos.
  • Comparaciones de diferentes modelos de aprendizaje basado en máquina para identificar el menor al instante.
  • Exploración y visualización interactiva de datos de resultados de modelos.
  • * Evaluación automatizada de modelos de ensamble para identificar los que tengan el mejor desempeño.
  • * Fácil implementación de modelos para que pueda tomar decisiones repetibles y objetivas al instante.
  • * Plataforma completa integrada para la automatización del proceso de datos a decisión.

Experience and expertise

En SAS, buscamos y evaluamos continuamente nuevos enfoques. La nuestra es una larga historia de implementar los métodos estadísticos que mejor se acoplen para resolver los problemas que usted enfrenta. Combinamos nuestra herencia rica y refinada en estadística y minería de datos con nuevos adelantos arquitectónicos para garantizar que sus modelos funcionen a la mayor velocidad posible (incluso en entornos empresariales enormes).

Entendemos que generar valor rápido no sólo significa un rápido desempeño de modelos automatizados, sino también tiempo NO perdido en mover datos entre plataformas. Las técnicas analíticas distribuidas de alto desempeño aprovechan el procesamiento masivamente paralelo integrado con Hadoop, así como también todas las bases de datos principales. Puede recorrer rápidamente todos los pasos del proceso de modelado, sin mover datos.

Soluciones de aprendizaje basado en máquina recomendadas de SAS

¿Desea más información relevante?

Big Data Insights

Big Data

Obtenga más información relevante sobre Big Data, incluyendo artículos, investigación y otros temas de actualidad.

Fraud & Risk Insights

Riesgo y fraude

Descubra nueva información relevante sobre riesgo y fraude a través de investigación, artículos relacionados y mucho más.

Marketing Insights

Marketing

Explore información relevante de eruditos en marketing sobre diversos temas oportunos.

Back to Top