Produkte & Lösungen / Data Management

Hadoop, Big Data und SAS®

Inzwischen ist allgemein klar geworden, dass Big Data der neue Standard ist, und die Unternehmen machen sich bereit für Big Data Analytics. Warum? Weil man den Wert der riesigen und vielfältigen Datenmengen realisieren muss, die derzeit auf Plattformen wie Hadoop gespeichert werden. Das Kombinieren der Vorteile von Hadoop mit der leistungsfähigen Geschäftsanalyse von SAS hilft Ihren Datenforschern, Big Data in großes Wissen zu transformieren.

Aber Big Data-Bestrebungen sind nicht auf den Zugriff auf Informationen beschränkt. Deshalb sorgen die Produkte und Dienste von SAS für nahtlosen und transparenten Zugriff auf die Abfragesprachen Pig und Hive sowie das MapReduce Framework. Die SAS Umgebung bietet außerdem eine visuelle und interaktive Hadoop-Erfahrung und erleichtert es so, Einblicke zu gewinnen und Trends zu erkennen. Leistungsstarke Analysealgorithmen helfen, wertvolle Informationen aus den Daten zu extrahieren, und In-Memory-Technologien bieten Möglichkeiten zur schnelleren Verarbeitung all dieser Daten. Und mit der integrierten und automatisierten Bereitstellung von Analysemodellen können Sie Daten jetzt direkt in Hadoop auswerten, um schnellere Ergebnisse zu erzielen.


Mit SAS® und Hadoop von Daten zu Entscheidungen

Hadoop life cycle

Wie SAS® helfen kann

Die SAS Unterstützung für Hadoop umfasst den gesamten Prozess von Daten zu Entscheidungen und konzentriert sich auf ein Ziel – Ihnen schneller zu mehr Wissen verhelfen, damit Sie bessere Entscheidungen treffen können. SAS bietet:

  • Datenmanagement für Analysen.
  • Untersuchung und Visualisierung für einfachere Einblicke.
  • Tiefenanalyse und Entwicklung von Analysemodellen.
  • Bereitstellung und Ausführung des Analysemodells für die Entscheidungsfindung.

Daten verwalten

  • Einfacher Zugriff und Nutzung der auf Hadoop gespeicherten Daten. Die SAS/ACCESS®-Software bietet schnellen, effizienten Zugriff auf in Hadoop gespeicherte Daten über HiveQL. Sie können auf Hive-Tabellen zugreifen, als ob es native SAS Datensätze wären. Anschließend wenden Sie Text Mining und Predictive Analytics auf die Daten an, um neue Einblicke zu gewinnen und auszutauschen.
  • Maximierung von Hadoops Fähigkeiten zur verteilten Verarbeitung. Ihre SAS Programmierer können MapReduce-, Scripting- und HDFS-Befehle aus Base SAS senden. SAS unterstützt auch externe Dateiverweise, sodass Sie aus jedem SAS Produkt bequem Hadoop-Dateien finden und nutzen können.
  • In Hadoop gespeicherte Daten besser verwalten. Ein Problem bei Hadoop-Implementierungen ist der Mangel bzw. die Unreife von Tools zur Verwaltung der Anwendungen. SAS Data Management bietet eine intuitive GUI, mit der Sie problemlos Auftragsabläufe erstellen können, die Pig-, MapReduce- und HDFS-Befehle und Hive-Abfragen verwenden. SAS Data Management verbessert mit Tools zur visuellen Editierung und einem integrierten Syntax-Checker die Code-Generierung in Pig und MapReduce. Darüber hinaus erhalten Sie die zusätzlichen Vorteile von Metadatenmanagement, Datenherkunft und Sicherheitsfunktionen.

Untersuchen und visualisieren

  • Schnell in Hadoop gespeicherte Daten visualisieren, neue Muster erkennen und Berichte veröffentlichen. SAS Visual Analytics ist eine In-Memory-Lösung für die schnelle Untersuchung von Daten. Sie hilft Ihnen, Möglichkeiten für weitere Analysen zu identifizieren und Ergebnisse über Web-Berichte und mobile Geräte auszutauschen.

Analysieren und modellieren

  • Domänenspezifische High-Performance Analytics auf in Hadoop gespeicherte Daten anwenden. SAS High-Performance Analytics bietet In-Memory-Fähigkeiten, mit denen Sie Analysemodelle auf Basis sämtlicher Daten und nicht nur von Teilmengen entwickeln können, genauere und zeitigere Einblicke produzieren und häufige Modellieriterationen durchführen können sowie ausgeklügelte Analysen nutzen können, um schnell Antworten auf Fragen zu erhalten, an die Sie bisher noch nicht gedacht hatten – oder die zu stellen Sie nicht die Zeit hatten.
  • Mit einer interaktiven und visuellen Analyseumgebung Muster und Trends in Hadoop-Daten erkennen. SAS Visual Statistics (ab März 2014) erlaubt es verschiedenen Nutzern, komplexe Probleme gleichzeitig zu lösen und neue Möglichkeiten zu identifizieren, indem Muster und Trends schneller denn je aufgedeckt werden. Mithilfe von vielfältigen statistischen Algorithmen und maschinellen Lernverfahren können Sie schnell unerwartete Erkenntnisse hervorbringen. Treffen Sie Ihre Entscheidungen anhand von faktenbasierten Erkenntnissen aus allen Ihren Daten.

Bereitstellen und ausführen

  • Automatisch Analysemodelle in der parallelen Umgebung bereitstellen und auswerten. SAS Scoring Accelerator for Hadoop automatisiert die Bereitstellung von Modellen im Cluster und ermöglicht Ihnen das Auswerten neuer Daten in Hadoop, ohne die Daten zu bewegen. Das beschleunigt die Ad-hoc-Modellierung und Auswertung neuer Daten und liefert schnellere Ergebnisse.

Von Daten zu Entscheidungen in einer einzigen, interaktiven Umgebung

  • Verwenden Sie eine einzige, interaktive Programmierumgebung für den gesamten Prozess von Daten zu Entscheidungen. Eine neue interaktive Programmierumgebung (erscheint Ende 2013) erlaubt es verschiedenen Nutzern, gleichzeitig Daten zu verwalten, Variablen zu transformieren, explorative Analysen durchzuführen und Modelle zu vergleichen und auszuwerten – praktisch ohne Limit für die Größe der in Hadoop gespeicherten Datenmengen. Die Persistenz der In-Memory-Daten beseitigt das wiederholte Laden von Daten und wiederholte Datendurchläufe. Das Ergebnis? Beschleunigung von interaktiver Ad-hoc-Analyse und Datenmanagement und deutliche Produktivitätssteigerungen.


Warum Sie SAS® und Hadoop brauchen

  • Umfassende Unterstützung für Hadoop. SAS/ACCESS liest nicht nur in HDFS gespeicherte Big Data aus, sondern gibt Ihnen auch die Möglichkeit, andere Ressourcen wie die Pig- und Hive-Sprachen und das MapReduce Framework einzubinden und zu nutzen.
  • Flexible Architektur. Weil der Schwerpunkt von SAS bei der Analyse und nicht bei der Speicherung liegt, ermöglichen wir eine flexible Auswahl der Hardware- und Datenbankanbieter. Wir arbeiten mit unseren Kunden zusammen, um die richtige Kombination von Technologien bereitzustellen, einschließlich der Möglichkeit, Hadoop mit anderen Data Warehouse-Technologien einzusetzen.
  • Vollständige Unterstützung des Prozesses von Daten zu Entscheidungen. SAS unterstützt den gesamten Analyselebenszyklus von Datenaufbereitung und Untersuchung bis zu Modellentwicklung, Produktionsübergabe und Überwachung.
  • Transparent, kollaborativ, interaktiv und iterativ. SAS ermöglicht Ihnen die Analyse großer, vielfältiger und komplexer Datensätze in Hadoop in einer einzigen Umgebung – Sie müssen nicht mit einer Mischung von Sprachen und Produkten verschiedener Anbieter arbeiten.

Wünschen Sie weitere Informationen?

Sie erreichen die SAS-Experten unter +49 6221 415-123 (Deutschland) oder per E-Mail an info@ger.sas.com.