Les solutions SAS® pour Hadoop
Hadoop fournit les big data.
Nous fournissons tout le reste.
89%* des entreprises voient Hadoop comme une opportunité. En êtes-vous ?
Vous avez choisi d'utiliser Hadoop pour le traitement de vos big data ? Comment l’intégrer dans votre éco-système décisionnel ? En combinant les solutions analytiques de SAS, les capacités de stockage et les traitements distribués d’Hadoop, vous pouvez exploiter de manière optimale vos « big data ». De l’intégration à la visualisation interactive, du calcul des scores à leur mise en production, SAS offre une couverture complète du cycle analytique en tirant parti d’une infrastructure Hadoop. Donnez du sens à vos données et saisissez de nouvelles opportunités.
En adaptant ses technologies analytiques in-memory à Hadoop, SAS offre un environnement analytique performant aux entreprises qui veulent tirer un réel profit des big data.
*D'après l'étude 2015 TDWI Best Practices Report, Hadoop for the Enterprise, par Philip Russom.
Exploration & Data Visualisation
Comprendre toutes vos données.
Le défi majeur avec Hadoop est de retrouver l’information dans des volumes de données monstrueux.
Explorer visuellement toutes les données disponibles, quel qu’en soit le volume, facilite leur compréhension et permet de repérer rapidement les caractéristiques les plus importantes.
Apprécier facilement les tendances et les relations est la première étape vers la constitution d’un capital informationnel exploitable.
- Exploration visuelle et interactive des données stockées dans Hadoop, quel qu’en soit le type (structuré et non structuré).
- Découvertes de relations inconnues.
- Analyser vos tweets stockés dans Hadoop. Utiliser les nuages de mots pour résumer et comprendre toutes vos données textuelles.
- Utiliser des méthodes analytiques, (corrélations, régression, prévision….) sans être un expert, dans une interface simple et conviviale.
- Assembler, diffuser vos rapports, et collaborer autour de l’information produite. Que votre point d’accès soit un navigateur, une tablette ou même Microsoft Office.
- Exploration graphique et analytique
- Analytique simple d’utilisation
- Serveur In-memory pour des temps de réponse immédiats
- BI Self-service
- Intégration avec Microsoft Office
Gestion de données pour Hadoop
Tirer de la valeur de vos big data.
La première vague des outils Big data ont été orientés sur le stockage et l’archivage. Mais la gestion du volume de données ne donne pas d’avantage compétitif.
SAS vous aide à tirer le meilleur profit de votre capital données afin de produire de l’information pertinente, fiable et exploitable. Que les données proviennent d’Hadoop (grâce à un accès rapide et facile à Hadoop) ou d’ailleurs.
En apprendre davantage sur SAS® Data Management
En savoir plus sur SAS® Data Loader for Hadoop
Business Intelligence : comment intégrer Hadoop en douceur Etude réalisée par IT Business Review
- Exploiter les données d’Hadoop de façon simple et sans avoir recours à des langages spécialisés.
- Etendre votre écosystème de données au support des big data.
- Ajouter une gouvernance de la donnée à votre infrastructure Hadoop.
- Donner de la qualité à votre démarche analytique.
- Mettre de la synergie entre DSI et les métiers pour l’exploitation des big data.
- Tirer de la valeur de vos big data.
En apprendre davantage sur SAS® Data Management
En savoir plus sur SAS® Data Loader for Hadoop
Business Intelligence : comment intégrer Hadoop en douceur Etude réalisée par IT Business Review
- Accès aux données stockées dans Hadoop, comme dans n’importe quel autre espace de stockage.
- Support des distributions Cloudera et Hortonworks.
- Intégration de Hive, Impala, MapReduce, Pig et des autres technologies liées à Hadoop.
- Traitement In-database pour bénéficier des traitements massivement parallèles et de l’infrastructure multiserveur d’Hadoop.
En apprendre davantage sur SAS® Data Management
En savoir plus sur SAS® Data Loader for Hadoop
Business Intelligence : comment intégrer Hadoop en douceur Etude réalisée par IT Business Review
Analytique pour Hadoop
Accélérer vos études et expérimentations.
Produire de l’information à partir des big data nécessite une approche différente. Pour donner du sens à vos données, identifier des tendances, anticiper les besoins de vos clients, prédire leurs comportements d’achats ou prévoir vos chiffres d’affaires par produit, vous avez besoin d’un logiciel d’analyse avec des qualités de rapidité et de puissance éprouvées. Accessible, fiable et simple à utiliser.
- Naviguer au sein de données complexes et hétérogènes.
- Utiliser toutes les données nécessaires à la compréhension de vos problèmes et pas seulement les échantillons supportés par votre environnement.
- Accélérer vos études et expérimentations.
- Solutionner les problèmes que vous ne pouviez traiter auparavant.
- Partager et collaborer.
- Environnement logiciel qui tire parti de l’infrastructure technique Hadoop.
- Interface simple et efficace pour la mise au point de modèles.
- Exploration de données à grande échelle.
- Réduction de variables en mode haute performance.
- Algorithmes statistiques et méthodes de “Machine Learning” en mode haute performance.
- Evaluation, suivi et comparaison de la performance de vos modèles.
Déploiement et exécution
Au sein même de l’infrastructure Hadoop.
Le déploiement de modèles analytiques est souvent consommateur de ressources. Le traitement manuel de ce processus peut aussi générer des erreurs.
L’automatisation de vos processus de scoring au sein même de l’infrastructure Hadoop accélère votre efficience analytique. Plus besoin de déplacer vos données, les traitements sont réalisés in situ.
- Automatiser la mise en production de vos processus de scoring.
- Réduction des mouvements et de la réplication de vos données sur votre réseau.
- Synergie et efficacité entre la DSI et les métiers.
- Les modèles produits par SAS® Enterprise Miner™ et SAS/STAT® sont automatiquement transformés pour être déployés et exécutés au plus près des données.
- Utilisation de la technique MapReduce pour répartir les traitements de scoring sur l’infrastructure Hadoop.
- Le workflow complet, incluant les transformations de données, est converti ce qui diminue grandement la préparation des données nécessaires au processus de scoring.
- Intégrité et protection des processus de scoring.
Pour le Data Scientist
Complétude du processus analytique.
L’un des élément-clés pour la compréhension et la création de valeur en provenance des big data est la compétence des collaborateurs les traitant. Le rôle émergent de « Data Scientist » est majeur dans l’utilisation d’Hadoop. Il nécessite un équilibre entre les compétences informatiques et analytiques dans une compréhension très fine du sens des données utilisées.
SAS permettra à un grand nombre d’utilisateurs simultanés de gérer, d'explorer et d'analyser des données, de créer et de comparer des modèles, et de classifier d'énormes quantités de données au cœur même de l’environnement Hadoop. La richesse des fonctions analytiques utilisables dans un mode très interactif donnera aux entreprises intéressées par ce framework les moyens d’augmenter considérablement la productivité de leurs data scientists.
Désormais, les statisticiens et autres data scientists qui analysent ou modélisent des données sur Hadoop, n'auront plus besoin de faire appel aux multiples outils d’analyses et autres langages de programmation spécifiques qui se sont développés autour de ce framework. SAS® In-Memory Statistics for Hadoop est une solution analytique collaborative, riche, complète et puissante.
- Elimination des silos de données grâce à un accès partagé et performant aux données stockées en mémoire.
- Complétude du processus analytique.
- Productivité accrue à travers un environnement intégré.
- Possibilité d'effectuer simultanément et en continu de multiples analyses au sein d’une même session d’analyse et pour plusieurs utilisateurs.
- Environnement interactif de programmation en prise directe sur l’infrastructure Hadoop.
- Environnement unique et complet pour supporter le cycle analytique.
- Traitement et gestion des big data.
- Statistiques, analyses textuelles et algorithmes de “Machine Learning”
- Utilisation des clusters de traitement Hadoop.
- Extensible (scalabilité) par construction.
- SAS/ACCESS® Interface to HadoopGet out-of-the-box connectivity between SAS and Hadoop, via Hive.
- SAS® Data Loader for HadoopManage big data on your own terms – and avoid burdening IT – with self-service data integration and data quality.
- SAS® Econometrics Analyze complex business and economic scenarios, providing a scientific basis for better decision making.
- SAS® Event Stream ProcessingGet immediate analytic insights from real-time big data streaming into your organization.
- SAS® In-Memory StatisticsFind insights in big data with a single environment that moves you quickly through each phase of the analytical life cycle.
- SAS® OptimizationFind optimal solutions to complex business and planning problems faster than ever.
- SAS® Scoring AcceleratorAutomate data scoring processes within the database to improve model performance and get faster results.
- SAS® Visual AnalyticsVisually explore all data, discover new patterns and publish reports to the web and mobile devices.
- SAS® Visual Data Mining and Machine LearningRésolvez vos problèmes les plus complexes avec un environnement intégré « in-memory ».
- SAS® Visual StatisticsCreate and modify predictive models faster than ever using a visual interface and in-memory processing.
- Service Offerings for HadoopGet the most out of your Hadoop data with support, training and resources from SAS.
Visit SAS Insights, your source for top big data and Hadoop news, views and best practices.