Press Release
Noticias |
Un nuevo paradigma en Data Mining: SAS Rapid Predictive Modeler | SAS EDUCACIÓN ARGENTINABuenos Aires, Argentina (12 Oct. 2011) – Hasta ahora, el paradigma convencional de Data Mining en SAS ponía en el centro de la escena al analista de data mining, una persona con una formación en estadística pero, posiblemente, un conocimiento mucho menor del negocio. Dentro de este paradigma, un especialista de negocios plantea inicialmente un problema. El analista de data mining debe analizarlo desde un punto de vista estadístico, determinar la factibilidad de que pueda resolverse con técnicas de data mining e interactuar con algún administrador de bases de datos para, primero, determinar la disponibilidad de datos apropiados y, luego, obtenerlos en un formato, calidad y cantidad adecuados. Después, el data miner debe preparar los datos apropiadamente (resolver cuestiones como las de valores faltantes, valores atípicos o extremos, distribuciones sesgadas, sucesos infrecuentes tanto en la variable target como en las variables predictoras, seleccionar las variables más relevantes, etc.), desarrollar modelos (usualmente bajo el paradigma del "modelo ganador"), seleccionar el modelo más apropiado, poner en producción el modelo y monitorear la degradación de su performance. Finalmente el especialista o analista de modelos interviene aplicando el modelo, evaluando su performance y eventualmente solicitando modificaciones y ajustes, a cargo del data miner.
Figura 1 - Paradigma convencional de data mining (centrado en el data miner)
Pero este enfoque con el data miner en el centro, que es la base de la precisión y robustez de los modelos predictivos aplicados a los negocios, es también su talón de Aquiles. El paradigma anterior le asigna al analista de negocios un rol secundario que no le permite aportar, en tiempo y forma, su considerable conocimiento específico en el desarrollo de una modelización. Este proceso suele ser demasiado rígido y prolongado para muchos de los problemas usuales de negocios. Muchas veces son necesarios modelos elaborados rápidamente y razonablemente precisos, aunque prescindiendo de la mayor robustez que podría aportarle (al menos en teoría) el conocimiento estadístico más profundo del analista de data mining. En otras palabras, muchas veces el analista de negocios debiera estar en el centro de la escena, debiera poder realizar sus propios modelos y, eventualmente y si esto es necesario, recurrir al data miner para refinarlos, monitorearlos, etc. El obstáculo principal para poner al analista de negocios en el centro de la escena es que si bien conoce profundamente su área específica, no tiene el mismo grado de conocimiento y experiencia de las técnicas analíticas (de preprocesamiento, modelización y postprocesamiento). Esto dificulta que SAS Enterprise Miner sea una herramienta apropiada para él, ya que su correcta y eficaz utililzación presupone un conocimiento estadístico importante. Para hacer realidad un nuevo paradigma complementario, que pone al analista de negocios en el centro de las tareas de modelización predictiva, surge el SAS Rapid Predictive Modeler. Esta nueva herramienta le permite al analista de negocios, aun cuando no posea conocimientos estadísticos, construir modelos predictivos rápida y efectivamente. Se trata de una tarea que ajusta modelos “prefabricados” de diversos niveles de complejidad. Es un add-in para SAS Enterprise Guide 4.3 o para Microsoft Office (solo Excel). Por debajo esta tarea usa el SAS Enterprise Miner para la realización de los modelos, aunque de un modo transparente para el usuario.
Figura 2 - Paradigma alternativo de data mining (centrado en el analista de negocios)
SAS Rapid Predictive Modeler le permite al analista de negocios seleccionar modelos prefabricados en tres niveles: básico, intermedio y avanzado. Maneja automáticamente la existencia de outliers, valores faltantes, sucesos target raros (infrecuentes), distribuciones sesgadas, selección de variables y de modelos. Presenta los resultados predictivos en términos de negocios de modos fáciles de comprender como gráficos de lift, scorecards y listados de las variables clave de un modelo. Los modelos pueden registrarse automáticamente en la plataforma de analytics de SAS para permitir la automatización del scoring y la utilización del modelo desde otros componentes, como el SAS Model Manager (para almacenamiento, monitoreo y ajuste). Desde este nuevo paradigma y mediante el SAS Rapid Predictive Modeler, el analista de negocios puede ocupar un rol central y producir de un modo autosuficiente los componentes esenciales de una modelización predictiva: desarrollar modelos predictivos rápidamente, automatizando gran parte del proceso, hacer scoring con el modelo desarrollado, producir reportes y análisis concisos y personalizables de las predicciones de un modelo y las razones de estas, registrar el modelo para su archivo y compartimiento con otras personas. El data miner, sin embargo, no queda afuera de la escena. Este deberá, si es necesario y utilizando el SAS Enterprise Miner como herramienta, refinar el modelo, importar resultados de modelos externos con fines de comparación, monitorear la performance del modelo a fin de detectar su degradación y realizar los ajustes necesarios. Además, el analista de data mining puede también hacer uso del SAS Rapid Predictive Modeler cuando necesita producir un modelo rápido, sin preocuparse por la multitud de detalles que habitualmente consumen gran parte de su tiempo.
Figura 3 – Nodo RPM en Enterprise Guide 4.3.
Este nuevo paradigma tiene la clara ventaja de llevar las técnicas de modelización predictiva de SAS a un nivel de disponibilidad e influencia sobre la toma de decisiones que no tiene precedentes. En cualquier empresa existen muchos más analistas de negocios que analistas de data mining/estadística, los que podrán aportar cantidades de elementos de juicio y criterios específicos del negocio al proceso de toma de decisiones mediante la realización de sus propios modelos. SAS Rapid Predictive Modeler es apropiado en cualquier escenario en el que el problema y los datos estén bien definidos, y donde sea necesario crear un modelo rápida y eficazmente. Puede aplicarse en cualquier industria vertical para resolver problemas comunes como la adquisición de clientes, cross- y upsell, retención de clientes, churn, etc. Los analistas de negocios serán autosuficientes en un desarrollo trasparente de modelos y una rápida puesta en producción. Además, los modelos (y todo el proyecto resultante) pueden ser examinados, refinados y monitoreados por parte de expertos en data mining, si ello fuera necesario. Para mayor información sobre SAS Rapid Predictive Modeler, puede consultar esta página web o SAS launches do-it-yourself predictive analytics for business users.
SAS es una empresa líder en soluciones y servicios de Business Analytics y el mayor proveedor independiente de Business Intelligence del mercado. Con innovadoras aplicaciones, apoyadas por una plataforma de inteligencia empresarial, SAS ayuda a que 45,000 sitios mejoren su desempeño y brinden valor para tomar decisiones de negocio más acertadas con mayor velocidad. Desde 1976, SAS otorga a sus clientes alrededor del mundo THE POWER TO KNOW®.
|
Contacto Editorial:
|