Blue Abstract art

Big data

De quoi s'agit-il?

Les big data désignent les gros volumes de données (structurées ou non) qui alimentent l'activité quotidienne d'une entreprise. Mais ce n’est pas la quantité des données qui compte, c'est ce que les entreprises en font. Il est possible d'analyser les big data pour en tirer des enseignements permettant de prendre de meilleures décisions et de lancer des initiatives stratégiques.

Historique et réflexions autour des big data

Si l'expression « big data » est relativement récente, la démarche consistant à recueillir et conserver de grandes quantités d'informations dans le but de les analyser est vieille comme le monde. Le concept a pris de l'ampleur au début des années 2000 lorsque l'analyste sectoriel Doug Laney a énoncé les trois caractéristiques désormais bien connues des big data, les « trois V » :

Volume. Les entreprises collectent des données de diverses sources : dont les transactions commerciales, médias sociaux et informations issues de capteurs ou de transactions de machine à machine. Auparavant, le stockage de ces données aurait posé problème, mais cette tâche est désormais simplifiée par les nouvelles technologies, notamment Hadoop.

Vitesse. Les données nous parviennent à un rythme de plus en plus soutenu et doivent être traitées rapidement. Balises RFID, capteurs et compteurs intelligents déversent des torrents d'informations qu'il faut analyser en temps quasi réel.

Variété. Les données revêtent tous types de formats : des données numériques structurées dans des bases de données traditionnelles aux documents texte non structurés, en passant par les e-mails, les vidéos, les fichiers audio, les données boursières et les transactions financières.

Chez SAS, nous y associons deux dimensions supplémentaires :

Variabilité. De plus en plus rapides et variés, les flux de données peuvent aussi être très irréguliers, avec des périodes de pointe. Une nouvelle tendance émerge sur les réseaux sociaux ? Les pics de données quotidiens, saisonniers ou déclenchés par un événement peuvent s'avérer difficiles à gérer, en particulier lorsqu'il s'agit de données non structurées.

Complexité. De nos jours, les données proviennent de multiples sources, ce qui complique l'établissement de liens et de correspondances, le nettoyage et la transformation entre différents systèmes. Cependant, il est nécessaire de connecter et corréler les relations, hiérarchies et nombreux liens entre les données, qui risquent sinon d’échapper à tout contrôle.

L'incroyable potentiel des big data

Les quantités de données créées et stockées à l’échelle mondiale sont déjà presque inconcevables et ne cessent de croître. La possibilité d'extraire des informations intéressantes est ainsi décuplée. Or, seule une faible proportion des données est réellement analysée. Quelles sont les conséquences pour les entreprises ? Comment peuvent-elles mieux exploiter les informations brutes qui transitent chaque jour par leurs services ?

Quel est l'intérêt des big data ?

Ce n’est pas la quantité des big data qui compte, mais l'usage qui en est fait. Il est possible d'analyser les données issues de n'importe quelle source pour y trouver des réponses permettant de 1) réduire les coûts, 2) gagner du temps, 3) développer de nouveaux produits et optimiser les offres et 4) prendre des décisions avisées. En associant les big data à de puissants outils d'analyse, vous pouvez accomplir des tâches essentielles pour l'entreprise :

  • Déterminer en temps quasi réel les causes premières des défaillances, problèmes et défauts.
  • Générer des bons de réduction sur le point de vente en fonction des habitudes d'achat du client.
  • Recalculer le risque sur des portefeuilles complets en quelques minutes.
  • Détecter un comportement frauduleux avant qu'il n’ait une incidence sur votre entreprise.

Les big data dans le monde d'aujourd'hui

Les big data (ainsi que leur gestion et leur exploitation par les entreprises) transforment les modes d'utilisation de l'information dans le monde entier. Découvrez quel est l'impact des big data.

Logo de livre blanc

Le renouveau de l'intégration des données, grâce aux big data

Pour rester pertinente, l'intégration des données doit porter sur de nombreux types et sources de données, tout en observant des temps de latence différents, du temps réel au flux continu. Découvrez comment l'intégration des données a évolué pour satisfaire aux nouvelles exigences.

Lire l'article

White paper icon

Guide des big data pour les non-geeks (en anglais)

Ce document explique comment un utilisateur métier techniquement aguerri peut utiliser Hadoop sans pour autant être un geek, et quel sera l’impact de cette évolution sur les environnements de données d'entreprise.
Lire la synthèse

Article icon

Faire la différence entre data lake et entrepôt de données

L'expression « data lake » (lac de données) relève-t-elle du jargon marketing à la mode ? Ou s'agit-il simplement d'une nouvelle appellation désignant un entrepôt de données ? Phil Simon fait le point sur la définition d'un data lake, son fonctionnement et son utilité.

Lire l'article

SAS Visual Analytics screenshot on monitor


Adding Hadoop to your Big Data Mix?

SAS provides everything you need to get valuable insights from all that data.

Learn more about big data solutions from SAS

Utilisation des big data

Les big data impactent la quasi totalité des secteurs d’activité. Découvrez comment chacun d’eux peut tirer parti de cet afflux d'informations.

Banque

Alimentées en continu par de grandes quantités d'informations issues d'innombrables sources, les banques doivent innover dans la gestion des big data. S'il est essentiel de bien comprendre les clients et d'améliorer leur satisfaction, il est aussi important de limiter les risques et la fraude, tout en se conformant à la réglementation en vigueur. Les big data fournissent de précieux enseignements, mais nécessitent que les institutions financières conservent leur avance en s'équipant d'analytique avancée.

Enseignement

Avec les informations tirées des données, les enseignants peuvent exercer une influence considérable sur les systèmes scolaires, les étudiants et les programmes. L'analyse des big data permet en effet d'identifier les étudiants à risque, de s'assurer que les élèves progressent de façon satisfaisante et de mettre en œuvre un meilleur système d'évaluation et de soutien des enseignants et directeurs d'établissement.

Secteur public

Lorsque les administrations parviennent à tirer parti de l'analytique appliquée à leurs big data, elles font d'énormes progrès en matière de gestion des services et organismes publics, de réduction des embouteillages ou de lutte contre la criminalité. Mais, si les big data présentent de nombreux avantages, les administrations doivent également résoudre les problèmes de transparence et de confidentialité.

Santé

Dossiers médicaux. Protocoles de soins. Médicaments prescrits. Dans le domaine de la santé, il faut toujours agir rapidement, avec précision et, dans certains cas, avec la transparence requise pour respecter la réglementation stricte du secteur. En gérant efficacement les big data, les professionnels de santé peuvent mettre en lumière des données jusqu'alors inconnues qui permettent d'améliorer la prise en charge des patients.

Secteur industriel

Forts des enseignements tirés des big data, les industriels peuvent améliorer la qualité et la productivité, tout en réduisant le gaspillage — des processus essentiels sur un marché très concurrentiel. De plus en plus d'industriels ont développé une culture de l'analytique, qui leur permet de résoudre les problèmes plus rapidement et de prendre des décisions plus avisées.

Grande distribution

Bâtir des relations avec la clientèle est un enjeu capital de la grande distribution, appuyer la relation client sur les big data en constitue la meilleure approche. Les marques doivent trouver la meilleure façon d'attirer la clientèle, de gérer les transactions et de regagner du terrain. Les big data sont encore et toujours au cœur de ces processus.

Les big data à l’œuvre : UPS

Entreprise toujours en mouvement, UPS stocke de grandes quantités de données, dont la plupart proviennent des capteurs qui équipent ses véhicules. Ces données surveillent les performances au jour le jour, mais sont également à l'origine d'une refonte majeure des itinéraires des chauffeurs de la société. Baptisé ORION (On-Road Integration Optimization and Navigation), le projet peut être considéré comme le plus ambitieux au monde en matière de de recherche opérationnelle. Il s'appuie essentiellement sur des données cartographiques en ligne pour réorganiser en temps réel les tournées des chauffeurs.

Il a permis d'économiser près de 32 millions de litres de carburant en raccourcissant les tournées quotidiennes de 127 millions de kilomètres. UPS estime que diminuer les parcours de 1,5 km par jour et par chauffeur permet à la société de réaliser 30 millions de dollars d'économies, ce qui est loin d'être négligeable.

 Ce ne sont pas les données brutes qui font la valeur des big data, mais leur traitement et leur analyse, ainsi que les informations, produits et services dérivés de l'analyse. Les mutations survenues dans les technologies et la gestion des big data doivent s'accompagner de changements tout aussi radicaux dans l'exploitation des données pour la prise de décision et la création de produits/services innovants.
Thomas H. Davenport dans Big Data in Big Companies (Les big data dans les grandes entreprises)
SAS Visual Analytics screenshot on monitor


Data Exploration & Visualization

SAS makes it easy to understand what your data has to tell you. Interactively explore billions of rows of data in seconds.

Learn more about big data solutions from SAS

Comment ça marche

Avant de savoir dans quelle mesure les big data peuvent être utiles à votre entreprise, vous devez connaître leur origine. Les sources des big data sont généralement de trois types :

Flux continus de données

Il s’agit des données transmises à vos systèmes informatiques par un réseau d'appareils connectés. Vous pouvez analyser ces données à mesure qu'elles vous parviennent et décider des informations à conserver, à éliminer ou à examiner de plus près.

Données des médias sociaux

Les données dérivées des interactions sociales présentent un intérêt croissant, en particulier dans les domaines du marketing, de la vente et du support technique. Elles se présentent souvent sous des formes non structurées ou semi-structurées, ce qui les rend particulièrement difficiles à utiliser et à analyser.

Sources publiques

D'énormes volumes de données sont accessibles via des sources de données ouvertes, telles que le portail data.gouv.fr/fr, le portail des données ouvertes de l'Union européenne ou le site opendatafrance.net.

Après avoir identifié toutes les sources potentielles de données, vous devez prendre un certain nombre de décisions pour commencer à les exploiter, en tenant compte des critères suivants :

Stockage et gestion

Il y a quelques années, le stockage aurait posé problème, mais il existe aujourd'hui des solutions économiques si la stratégie du stockage est celle qui convient le mieux à votre entreprise.

Volume à analyser

Certaines entreprises n'excluent aucune donnée de leurs analyses, comme les technologies ultra-performantes telles que le calcul distribué ou l'analytique en mémoire le permettent. Une autre approche consiste à identifier dès le départ les données pertinentes à analyser.

Exploitation des informations découvertes

Mieux vous êtes informé, plus vous pouvez prendre des décisions en connaissance de cause. Il est recommandé de mettre une stratégie en place dès que vous disposez d'un ensemble d'informations conséquent.

Enfin, la dernière étape consiste à rechercher les technologies qui vous permettront de tirer le meilleur parti des big data et de leur analyse. Voici quelques éléments à prendre en compte :

  • Stockage massif et à moindre coût.
  • Processeurs plus rapides.
  • Plates-formes big data distribuées, open source et abordables, telles que Hadoop.
  • Traitement parallèle, clusterisation, MPP, virtualisation, environnements de calcul distribué de grande envergure, forte connectivité et hauts rendements.
  • Cloud computing et autres configurations souples d'allocation de ressources.

Back to Top