Blue Abstract art

Big Data

Was es ist und was man darüber wissen sollte

Der Begriff „Big Data“ bezeichnet die große Menge an strukturierten und unstrukturierten Daten, die Unternehmen Tag für Tag überschwemmen. Nicht die Daten selbst sind so wichtig. Was zählt, ist das, was Unternehmen mit den Daten machen. Große Datenmengen können analysiert werden, um Erkenntnisse zu gewinnen und auf deren Grundlage bessere Entscheidungen zu treffen und das Unternehmen strategisch auszurichten.

Big Data – Geschichte und aktuelle Überlegungen

Der Begriff „Big Data“ ist zwar relativ neu, das Erfassen und Speichern großer Mengen an Informationen für eine spätere Analyse wird jedoch bereits seit sehr langer Zeit praktiziert. Der Begriff gewann in den frühen 2000er Jahren an Bedeutung, als Branchenanalyst Doug Laney die heute anerkannte Definition von Big Data in seinem 3-V-Modell formulierte:

Volume. Unternehmen sammeln Daten aus einer Vielzahl von Quellen: geschäftlichen Transaktionen, sozialen Medien sowie Sensor- oder Machine-to-Machine-Daten. Früher wäre die Speicherung dieser Daten ein Problem gewesen. Dank neuer Technologien wie Hadoop ist das heute viel einfacher.

Velocity. Die Datenströme bewegen sich in nie da gewesener Geschwindigkeit und müssen zeitnah verarbeitet werden. RFID-Tags, Sensoren und Smart Metering sorgen dafür, dass riesige Datenmengen nahezu in Echtzeit verarbeitet werden müssen.

Variety. Daten fallen in unterschiedlichsten Formaten an – von strukturierten, numerischen Daten aus herkömmlichen Datenbanken bis hin zu unstrukturierten Textdokumenten, E-Mail, Video, Audio, Börsentickerdaten und Finanztransaktionen.

Bei SAS berücksichtigen wir zwei weitere Dimensionen, wenn wir über Big Data nachdenken:

Variabilität. Zusätzlich zu der wachsenden Geschwindigkeit und Vielfalt der Daten kann der Datenfluss sehr unbeständig sein und periodische Spitzen aufweisen. Gibt es einen Trend in den sozialen Medien? Tägliche, saisonale und durch Ereignisse ausgelöste Datenspitzen sind unter Umständen schwer zu bewältigen. Das gilt umso mehr, wenn es sich um unstrukturierte Daten handelt.

Komplexität. Daten stammen heute aus verschiedenen Quellen und das macht es schwierig, sie systemübergreifend zu verknüpfen, anzupassen, zu bereinigen und zu übertragen. Sie müssen sie jedoch verbinden und Beziehungen, Hierarchien und vielfache Datenverknüpfungen korrelieren, da Ihre Daten sonst schnell außer Kontrolle geraten würden.

Das große Potenzial von Big Data

Weltweit wird eine fast unvorstellbare Datenmenge generiert und gespeichert – und sie wächst stetig weiter. Damit steigt auch das Potenzial, aus geschäftlichen Informationen wichtige Erkenntnisse abzuleiten – doch nur ein kleiner Prozentsatz der Daten wird tatsächlich analysiert. Was bedeutet das für Unternehmen? Wie können sie die Rohdaten, die Tag für Tag bei ihnen eingehen, besser nutzen?

Warum ist Big Data so wichtig?

Bei Big Data geht es nicht darum, wie viele Daten Sie haben, sondern darum, was Sie damit machen. Sie können Daten aus beliebigen Quellen erfassen und analysieren, um Antworten zu finden, die es Ihnen ermöglichen, 1. Kosten zu senken, 2. Zeit einzusparen, 3. neue Produkte und optimierte Angebote zu entwickeln und 4. klügere geschäftliche Entscheidungen zu treffen. Wenn Sie Big Data mit leistungsstarken Analytics kombinieren, können Sie geschäftsbezogene Aufgaben wie die folgenden bewältigen:

  • Feststellen der Ursachen für Fehlfunktionen, Probleme und Defekte nahezu in Echtzeit
  • Erstellen von Einzelhandelsgutscheinen auf Basis der Kaufgewohnheiten der Kunden direkt am Point of Sale
  • Neuberechnung ganzer Risikoportfolios in Minuten
  • Erkennung von betrügerischem Verhalten, bevor es sich auf Ihr Unternehmen auswirkt

Big Data heute

Big Data – und die Art und Weise, in der Unternehmen sie bewältigen und daraus Erkenntnisse ableiten – verändern weltweit die Nutzung geschäftlicher Informationen. Erfahren Sie mehr über die Auswirkungen von Big Data.

Logo für Whitepaper

Data Integration Deja Vu: Big Data Reinvigorates DI

Datenintegration ist nach wie vor relevant, sofern sie für viele verschiedene Datentypen und -quellen eingesetzt werden und mit unterschiedlichen Latenzen ablaufen kann – von Echtzeit bis hin zu Streaming. Erfahren Sie, wie die Datenintegration weiterentwickelt wurde, um den heutigen Anforderungen gerecht zu werden.

Whitepaper lesen

White paper icon

A Non-Geek’s Big Data Playbook

In diesem Whitepaper erfahren technisch versierte Business-Anwender, die nicht über Expertenwissen verfügen, wie sich Hadoop nutzen lässt – und wie sich dies auf Jahre hinaus auf die Datenumgebungen des Unternehmens auswirken wird.
Zusammenfassung lesen

Article icon

Data lake and data warehouse – know the difference

Ist der Begriff „Data Lake“ nur ein Marketinghype? Oder eine neue Bezeichnung für ein Data Warehouse? Phil Simon erklärt, was ein Data Lake ist, wie er funktioniert und wann Sie eventuell einen benötigen.

Artikel lesen

SAS Visual Analytics-Screenshot auf Monitor

Sie ergänzen Ihren Big Data-Mix durch Hadoop?

Bei SAS finden Sie alles Nötige, um aus all diesen Daten wertvolle Erkenntnisse abzuleiten.

Erfahren Sie mehr über Big Data-Lösungen von SAS

Wer nutzt Big Data?

Big Data betrifft Unternehmen in praktisch allen Branchen. Lesen Sie selbst, wie verschiedene Branchen von der enormen Informationsflut profitieren können.

Banking

Angesichts der großen Mengen an Informationen, die aus zahllosen Quellen eingehen, müssen Banken neue, innovative Möglichkeiten zur Handhabung von Big Data finden. Eine gute Kundenkenntnis und die Stärkung der Kundenzufriedenheit sind zwar wichtig, ebenso wichtig ist jedoch die Risiko- und Betrugsminimierung unter Einhaltung der gesetzlichen Vorschriften. Aus Big Data lassen sich viele Erkenntnisse ableiten, doch die Finanzinstitute sind auch gezwungen, Advanced Analytics einzusetzen, um die Daten zu bewältigen.<br>

Bildung

Mithilfe datengestützter Erkenntnisse können Bildungsinstitute erhebliche Verbesserungen für ihre Systeme, Studenten und Lehrpläne erzielen. Mit Big Data-Analysen können sie schwache Studenten ermitteln, für ausreichende Lernfortschritte sorgen und bessere Systeme zur Bewertung und Unterstützung von Lehr- und Führungskräften implementieren.

Government

Analytics-Verfahren für Big Data erschließen staatlichen Stellen erhebliche Vorteile beim Management von Versorgungsunternehmen, bei der Leitung von Behörden, der Bewältigung von Verkehrsstaus oder der Verbrechensbekämpfung. Neben den vielen Vorteilen, die Analytics-Verfahren für Big Data bieten, dürfen staatliche Stellen jedoch die Fragen von Transparenz und Datenschutz nicht aus dem Blick verlieren.

Gesundheitswesen

Patientenakten. Behandlungspläne. Verschreibungen. Im Gesundheitswesen zählen Schnelligkeit und Genauigkeit – und in manchen Fällen auch ein ausreichendes Maß an Transparenz, um strengen gesetzlichen Vorgaben Genüge zu tun. Mit effektivem Big Data-Management können Gesundheitsdienstleister verborgene Erkenntnisse zur Verbesserung der Patientenversorgung gewinnen.

Fertigung

Mit den Erkenntnissen aus Big Data-Analysen können Hersteller Qualität und Produktionsleistung steigern und gleichzeitig Verschwendung minimieren – wichtige Erfolgsvoraussetzungen in wettbewerbsintensiven Märkten. Immer mehr Hersteller arbeiten in einem Analytics-basierten Umfeld und können so Probleme schneller lösen und agilere Geschäftsentscheidungen treffen.

Einzelhandel

Der Aufbau von Kundenbeziehungen ist im Einzelhandel unerlässlich – und Big Data ist der Schlüssel dazu. Einzelhändler müssen wissen, wie sie ihre Kunden am besten ansprechen, wie sie Transaktionen am besten durchführen und wie eine effektive Strategie zur Kundenrückgewinnung aussehen muss. Big Data-Analysen bilden die optimale Grundlage dafür.

Big Data in Aktion: UPS

Bei UPS sind viele Dinge ständig in Bewegung und daher speichert das Unternehmen große Datenmengen. Viele dieser Daten stammen von Sensoren in den Fahrzeugen des Unternehmens. Diese Daten werden nicht nur zur Überwachung der täglichen Leistung genutzt, sondern lösten auch eine umfassende Neugestaltung der Routenstrukturen von UPS aus. Die Initiative mit dem Namen ORION (On-Road Integration Optimization and Navigation) war das wohl größte Operations-Research-Projekt weltweit. Es griff stark auf Onlinekartendaten zurück, um die Routen der Fahrer in Echtzeit neu zu konfigurieren.

Dank dieser Neukonfiguration wurden über 31,8 Millionen Liter Kraftstoff eingespart, denn die täglichen Routen konnten um gut 136 Millionen Kilometer verkürzt werden. UPS schätzt, dass durch die Einsparung von nur einer Meile pro Fahrer und Tag 30 Millionen US-Dollar gespart werden, die Gesamtersparnis ist also beträchtlich.

 Unbedingt zu bedenken ist, dass der eigentliche Wert von Big Data nicht in den Rohdaten liegt, sondern in den Erkenntnissen, Produkten und Services, die aus der Verarbeitung und Analyse dieser Rohdaten hervorgehen. Mit den weitreichenden Veränderungen in Big Data-Technologien und Managementstrategien muss ein ähnlich umfassender Wandel in der Art und Weise einhergehen, wie die Daten Entscheidungen und Innovationen bei Produkten und Services stützen.
Thomas H. Davenport in   „Big Data in Big Companies“
SAS Visual Analytics screenshot on monitor

Data Exploration & Visualization

SAS makes it easy to understand what your data has to tell you. Interactively explore billions of rows of data in seconds.

Learn more about big data solutions from SAS

Wie funktioniert das?

Bevor Sie ermitteln können, wie Ihr Unternehmen Big Data nutzen kann, müssen Sie sich zunächst damit befassen, woher die Daten stammen. Big Data-Quellen gehören üblicherweise zu einer von drei Kategorien:

Streaming-Daten

Hierzu gehören Daten, die von einem Netz verbundener Geräte in Ihren IT-Systemen eingehen. Sie können diese Daten analysieren, wenn sie eintreffen, und entscheiden, welche Daten Sie behalten, verwerfen und weiter analysieren wollen.

Daten aus sozialen Medien

Die Daten aus sozialen Interaktionen stellen eine zunehmend attraktive Informationsquelle dar, insbesondere für Marketing, Vertrieb und Support. Diese Daten liegen häufig in ganz oder teilweise unstrukturierter Form vor und stellen daher bei Verbrauch und Analyse eine besondere Herausforderung dar.

Öffentlich zugängliche Datenquellen

In offenen Datenquellen wie der Website data.gov der US-Regierung, dem CIA World Factbook oder dem Offenen Datenportal der EU stehen riesige Datenmengen zur Verfügung.

Nachdem Sie alle potenziellen Datenquellen identifiziert haben, bedenken Sie die nötigen Entscheidungen, die getroffen werden müssen, sobald Sie anfangen, Informationen zu nutzen. Hierzu gehören die folgenden:

Wie sollen Daten gespeichert und verwaltet werden?

Die Speicherung wäre vor einigen Jahren ein Problem gewesen, aber heute gibt es kostengünstige Datenspeicheroptionen, wenn dies die beste Strategie für Ihr Unternehmen ist.

Welche Daten sollen analysiert werden?

Manche Unternehmen schließen keine Daten aus der Analyse aus, da Hochleistungstechnologien wie Grid Computing oder In-Memory-Analytics dies heutzutage möglich machen. Eine andere Strategie besteht darin, vor der Analyse zu ermitteln, welche Daten überhaupt relevant sind.

Wie sollen die gewonnenen Erkenntnisse genutzt werden?

Je mehr Sie wissen, desto sicherer sind Sie in Ihren geschäftlichen Entscheidungen. Sobald eine Fülle von Informationen vorliegt, ist es natürlich klug, bereits über eine Strategie zu verfügen.

Im letzten Schritt bei der Nutzbarmachung von Big Data für Ihr Unternehmen gilt es, die Technologien zu finden, mit denen Sie den Nutzen von Big Data und Big Data-Analytics am besten erschließen können. Wichtige Aspekte:

  • Günstiger Speicher mit großer Kapazität
  • Schnellere Prozessoren
  • Bezahlbare verteilte und quelloffene Big Data-Plattformen wie Hadoop
  • Parallelverarbeitung, Clustering, MPP, Virtualisierung, große Grid-Umgebungen, hohe Konnektivität und hohe Durchsätze
  • Cloudcomputing und andere Konfigurationen mit flexibler Ressourcenzuteilung

Back to Top