SAP Datasphere hilft Unternehmen dabei, Daten aus unterschiedlichsten Quellen live zu analysieren, ohne dafür umfangreiche Vorarbeiten durchführen zu müssen. Dieser Beitrag beschreibt die Plattform im Detail!
SAP Datasphere ist eine cloudbasierte Datenmanagement-Plattform. Sie unterstützt Unternehmen dabei, ihre Daten effizient zu verwalten und auszuwerten. Als Nachfolger der SAP Data Warehouse Cloud besitzt die Lösung einen deutlich größeren Funktionsumfang. Dies gilt vor allem im Hinblick auf die Integrationsmöglichkeiten von SAP- und Non-SAP-Systemen und die Governance.
Mit SAP Datasphere können Unternehmen strukturierte und unstrukturierte Daten aus unterschiedlichen Quellen integrieren, modellieren und in Echtzeit analysieren. Die Besonderheit liegt darin, dass hierfür keine physische Datenmigration erforderlich ist. Somit ist eine sehr flexible und kosteneffiziente Nutzung geschäftsrelevanter Daten möglich – auch in hybriden und Multi-Cloud-Umgebungen.
SAP bezeichnet Datasphere als Grundlage für den Aufbau einer sogenannten Business Data Fabric. Es handelt sich dabei um ein Konstrukt, das jeden Mitarbeiter im Unternehmen mit aussagekräftigen Daten versorgt. Zudem ermöglicht es eine Business Data Fabric, Datensätze in sehr kurzer Zeit („on demand“) bereitzustellen und so zu beschreiben, dass sie auch von Fachanwendern ohne IT-Kenntnisse verstanden und genutzt werden können.
Die SAP Datasphere Plattform kombiniert verschiedene Funktionen aus dem Datenmanagement. Diese zielen darauf ab, die Datennutzung im Unternehmen zu vereinfachen und zu verbessern. Hervorzuheben sind vor allem folgende Eigenschaften und Features:
SAP Datasphere besitzt leistungsfähige Werkzeuge, mit denen Unternehmen Daten aus der Cloud und On-Premise-Quellen integrieren können. Dazu gehören sowohl relationale Datenbanken, Data Lakes und ERP-Systeme als auch Drittanbieter-Plattformen. Sämtliche Daten werden in einer semantischen Schicht logisch zusammengeführt, sodass sie für analytische und operative Anwendungen genutzt werden können.
Zum Verständnis: Eine semantische Schicht fungiert als Vermittler zwischen komplexen Datensystemen und den Fachanwendern. Sie übersetzt technische Datenstrukturen in verständliche, geschäftsbezogene Begriffe. Somit ist es auch für Nicht-IT-Mitarbeiter möglich, sie zu interpretieren und zu analysieren.
Mit den Modellierungsfunktionen von SAP Datasphere lassen sich semantische Datenmodelle erstellen, mit denen komplexe Zusammenhänge zwischen Daten abgebildet und interpretiert werden können. Diese Datenmodelle sind darauf ausgelegt, Daten aus verschiedenen Quellen logisch miteinander zu verknüpfen, ohne dass eine physische Konsolidierung erforderlich ist.
Diese Art der Modellierung hilft Anwendern dabei, Zusammenhänge zwischen Geschäftsdaten zu erkennen – beispielsweise welche Kunden welche Produkte wann gekauft haben. Sichtbar werden solche Beziehungen dank SAP Datasphere selbst dann, wenn die entsprechenden Informationen aus unterschiedlichen Systemen stammen.
Ein weiteres wichtiges Element der Plattform ist die Datenvirtualisierung. Sie erlaubt es Unternehmen, Daten aus verschiedenen Systemen zu analysieren, ohne sie physisch zu kopieren oder zu verschieben. So können SAP S/4HANA-Daten ebenso in Echtzeit genutzt werden wie Daten aus Drittanbieter-Quellen.
Der Vorteil des Ansatzes liegt zudem darin, dass Unternehmen keine aufwendigen Datenzusammenführungen durchführen müssen, um Auswertungen zu erstellen. Vielmehr greifen sie direkt auf die bestehenden Daten in den Quellsystemen zu. Das spart Zeit und reduziert Kosten. Zudem steigt die Datenqualität, da keine doppelten oder veralteten Datensätze entstehen.
Mit SAP Datasphere basieren Entscheidungen nicht auf historischen Daten, sondern auf Echtzeit-Informationen aus der Datenlandschaft. Möglich machen dies verschiedene Ansätze wie Streaming-Datenverarbeitung, Datenreplikation mit äußerst geringer Latenz sowie die zuvor erwähnte Virtualisierung. Diese Methoden sorgen dafür, dass Veränderungen in der Datenquelle mit minimalem Zeitverzug in der Datenbasis verfügbar sind.
Weiterhin stellt SAP Datasphere fortschrittliche Governance-Funktionen bereit. Diese steuern den Zugriff auf Datenquellen und stellen sicher, dass Compliance-Anforderungen eingehalten werden. Unternehmen können hierbei detaillierte Berechtigungen definieren, um zu gewährleisten, dass nur autorisierte Nutzer auf bestimmte Datensätze zugreifen.
Nicht zuletzt ist SAP Datasphere vollständig in das SAP-Ökosystem integriert – einschließlich der SAP Analytics Cloud, SAP BW/4HANA und SAP S/4HANA. Gleichzeitig lassen sich auch Drittanbieter-Lösungen wie Databricks, Snowflake oder Google BigQuery anbinden.
Zusammengefasst lassen sich die wichtigsten Eigenschaften von SAP Datasphere wie folgt skizzieren:
Eigenschaft | Beschreibung |
Datenvirtualisierung | Zugriff auf verteilte Datenquellen ohne physische Replikation |
Datenmodellierung | Erstellung semantischer Modelle für erweiterte Analysen |
Echtzeit-Datenverarbeitung | Integration und Analyse von Daten in Echtzeit |
Daten-Governance | Strenge Zugriffskontrollen und Datenschutzmaßnahmen |
Moderne Architektur | Cloud-native Lösung mit hybriden Integrationsmöglichkeiten |
Business Data Fabric | Einheitliche Datenbasis für alle Analyse-Anwendungen |
SAP Datasphere hat vielfältige Vorteile für Unternehmen. Allen voran ist die einheitliche Sicht auf verteilte Daten zu nennen, welche maßgeblich zur Verbesserung von Geschäftsentscheidungen beiträgt. Nochmals hervorzuheben ist an dieser Stelle zudem, dass sämtliche Daten in Echtzeit (oder zumindest in „Near-Realtime“) zur Verfügung stehen. Somit basieren Entscheidungen nicht nur auf einer breiteren Datenbasis, sondern auch auf aktuellen Informationen.
Ein weiterer Mehrwert liegt in der Entkopplung von Datenzugriff und Datenhaltung. Unternehmen müssen hierdurch nicht länger aufwendige Prozesse wie ETL (Extract, Transform, Load) durchlaufen. Auch eine redundante Datenspeicherung ist nicht mehr erforderlich. Dadurch werden Daten-Workflows agiler. Dies wiederum ermöglicht eine schnellere Anpassung an neue Anforderungen. Gleichzeitig wird die Komplexität im Datenmanagement reduziert, was IT-Kosten senkt.
Nicht zuletzt fördert SAP Datasphere eine datengetriebene Unternehmenskultur, da es die Fachbereiche in die Lage versetzt, direkt auf geschäftsrelevante Informationen zuzugreifen und diese konsolidiert zu betrachten. Zum Vergleich: In früheren Umgebungen mit einem Business Warehouse war dies nicht möglich. Hier war es notwendig, Daten für Reports zunächst zentral bereitzustellen. Zudem mussten neue Berichte in der Regel durch IT-Experten erstellt werden, was mitunter lange Wartezeiten verursachte.
Zusammengefasst stellen sich die Vorteile von SAP Datasphere wie folgt dar:
SAP Datasphere ist technisch wie ein modernes Data-Warehouse aufgebaut, aber cloudbasiert und deutlich flexibler. Die Architektur gliedert sich grob in drei Hauptbereiche beziehungsweise Schichten:
In dieser Schicht befinden sich alle Systeme, aus denen Daten stammen. Dazu zählen beispielsweise SAP S/4HANA, SAP BW oder MS SQL Server. Über Schnittstellen und Konnektoren wie den SAP Cloud Connector oder den Data Provisioning Agent (DP Agent) werden diese Quellen an SAP Datasphere angebunden. Dabei lassen sich die Daten entweder live anbinden oder gezielt in die Plattform laden.
In dieser Schicht findet die eigentliche Datenaufbereitung statt. SAP unterscheidet hier zwei Arbeitsbereiche (sogenannte Spaces):
Technisch steckt dahinter ein mehrstufiger Aufbau, vergleichbar mit klassischen Data-Warehouse-Architekturen.
In dieser Schicht werden die zuvor erstellten Datenmodelle von Tools wie SAP Analytics Cloud, Power BI, Excel oder Cubeware abgefragt. Der Zugriff erfolgt über Standardschnittstellen wie ODATA oder JDBC. Besonders eng ist die Integration mit der SAP Analytics Cloud. Die Analyse-Lösung kann mehrere Modelle – ohne zusätzliche Datenvorbereitung – direkt aus SAP Datasphere übernehmen.
Um Unternehmen den Zugang zu erweiterten Analyse-, Integrations- und Governance-Funktionen zu ermöglichen, arbeitet SAP mit mehreren Technologiepartnern zusammen. Vier davon spielen strategisch eine besonders wichtige Rolle:
Collibra erweitert SAP Datasphere um weitreichende Governance-Funktionen. Dazu gehören ein zentraler Datenkatalog, Lineage-Tracking (Herkunft von Daten), Datenqualitätsrichtlinien und Compliance-Funktionen. Collibra verbessert somit die Kontrolle über die Datenherkunft und -nutzung. Besonders wichtig ist dies in regulierten Branchen.
Mithilfe von Apache Kafka ermöglicht Confluent die Verarbeitung von Echtzeit-Datenströmen aus Sensoren, Transaktionen oder Logistiksystemen. Dadurch lassen sich aktuelle Ereignisse unmittelbar in SAP Datasphere nutzen – beispielsweise für Live-Analysen oder sofortige Prozessanpassungen.
Databricks verbindet SAP-Daten mit modernen Data-Lake-Technologien. Unternehmen können damit große Datenmengen aus unterschiedlichen Quellen zusammenführen. Zudem ist es möglich, die Datenbestände schnell und flexibel auszuwerten. Wichtig ist diese Eigenschaft zum Beispiel für anspruchsvolle Analysen oder den Einsatz von Künstlicher Intelligenz.
Mit DataRobot wird SAP Datasphere um Automated Machine Learning (AutoML) ergänzt. Auch ohne Data-Science-Kenntnisse können Fachanwender mithilfe der Technologie Prognosemodelle auf Basis von SAP-Daten automatisiert erstellen. Diese Modelle lassen sich direkt in Berichte oder operative Anwendungen integrieren.
Um SAP Datasphere nutzen zu können, müssen einige Voraussetzungen erfüllt sein. Allen voran benötigen einen Zugang zur SAP Business Technology Platform (SAP BTP). Denn SAP Datasphere ist ein Cloud-Service innerhalb dieser Plattform. Entsprechend erfolgt auch die Lizenzierung von SAP Datasphere über die BTP.
Weiterhin sollten folgende Anforderungen erfüllt sein:
SAP Datasphere ist das technologische Herzstück einer SAP Business Data Fabric. Letztere verfolgt das Ziel, Daten aus unterschiedlichsten Systemen einheitlich, verlässlich und kontextbezogen nutzbar zu machen – ohne sie verschieben oder duplizieren zu müssen.
Hierzu verbindet SAP Datasphere die verschiedenen Systeme, vereinheitlicht die Daten, stellt Zusammenhänge her und macht die Informationen über Systemgrenzen hinweg verfügbar.
Bereits SAP Data Warehouse Cloud (SAP DWC) basierte auf der Idee, Unternehmen ein cloudbasiertes, semantisch orientiertes Datenmanagementsystem bereitzustellen. Dieses Konzept wurde in SAP Datasphere nicht nur übernommen, sondern deutlich weiterentwickelt. Folgende Übersicht gibt Aufschluss über die Unterschiede:
Eigenschaft | SAP Data Warehouse Cloud | SAP Datasphere |
Strategische Positionierung | Reines Cloud-Data-Warehouse | Zentrale Komponente der SAP Business Data Fabric |
Fokus | Datenmodellierung und Reporting | Ganzheitliches Datenmanagement (Integration, Kontext und Governance) |
Semantik und Kontext | Grundfunktionen vorhanden | Erweiterte semantische Schicht, automatische Übernahme aus SAP-Systemen |
Governance | Basisfunktionen | Erweiterte Daten-Governance (zum Beispiel durch Collibra-Integration) |
Integrationsmöglichkeiten | SAP-zentriert, begrenzte Optionen für Drittsysteme | Offenes Datenökosystem mit vielfältigen Integrationsmöglichkeiten (SAP und Non-SAP) |
Datenzugriff | Datenreplikation im Vordergrund | Flexible Kombination aus Replikation und Virtualisierung |
Datenbereitstellung | Tabellenorientiert | Geschäftsorientierte Datenprodukte und Spaces |
SAP Data Warehouse Cloud:
Reines Cloud-Data-Warehouse
SAP Datasphere:
Zentrale Komponente der SAP Business Data Fabric
SAP Data Warehouse Cloud:
Datenmodellierung und Reporting
SAP Datasphere:
Ganzheitliches Datenmanagement (Integration, Kontext und Governance)
SAP Data Warehouse Cloud:
Grundfunktionen vorhanden
SAP Datasphere:
Erweiterte semantische Schicht, automatische Übernahme aus SAP-Systemen
SAP Data Warehouse Cloud:
Basisfunktionen
SAP Datasphere:
Erweiterte Daten-Governance (zum Beispiel durch Collibra-Integration)
SAP Data Warehouse Cloud:
SAP-zentriert, begrenzte Optionen für Drittsysteme
SAP Datasphere:
Offenes Datenökosystem mit vielfältigen Integrationsmöglichkeiten (SAP und Non-SAP)
SAP Data Warehouse Cloud:
Datenreplikation im Vordergrund
SAP Datasphere:
Flexible Kombination aus Replikation und Virtualisierung
SAP Data Warehouse Cloud:
Tabellenorientiert
SAP Datasphere:
Geschäftsorientierte Datenprodukte und Spaces
Mit SAP Data Intelligence Cloud steht parallel zu SAP Datasphere eine weitere Datenmanagement-Lösung zur Verfügung. Die beiden Produkte unterscheiden sich jedoch durch ihren Fokus und ihre Zielgruppe.
SAP Datasphere konzentriert sich auf geschäftsorientiertes Datenmanagement. Ein besonderer Fokus liegt auf semantischer Konsistenz und Self-Services für Datenanwender. Die Zielgruppen sind vor allem Fachbereiche und BI-Teams, die Daten für Analysen und Berichte benötigen.
SAP Data Intelligence Cloud ist hingegen eine spezialisierte Lösung für die technisch komplexe Datenorchestrierung. Sie unterstützt vor allem den Aufbau und die Verwaltung von Datenpipelines. Konzipiert wurde SAP Data Intelligence Cloud vordergründig für Dateningenieure. Entsprechend beinhaltet die Lösung umfangreiche Möglichkeiten zur Verarbeitung unstrukturierter Daten, zur Datenaufbereitung für KI-Anwendungen sowie zur Verwaltung heterogener Datenlandschaften.
Kurz: SAP Datasphere fokussiert sich auf die geschäftsorientierte Datenbereitstellung, SAP Data Intelligence Cloud auf die technische Datenintegration und Pipeline-Steuerung.
Hinweis: SAP plant, Datasphere und Data Intelligence Cloud zunächst parallel anzubieten. Langfristig soll Datasphere die Aufgaben jedoch vollständig übernehmen. Dafür werden die Funktionen der Data Intelligence Cloud schrittweise in Datasphere integriert.
SAP Datasphere und SAP Analytics Cloud (SAC) arbeiten eng zusammen. Grob skizziert ist Datasphere für die Lieferung der Daten, SAC hingegen für deren Auswertung zuständig. Die Integration ist hierbei so gestaltet, dass Datenmodelle aus Datasphere direkt und live in der SAC genutzt werden können, ohne dass eine physische Datenverschiebung oder doppelte Datenpflege notwendig ist.
Ein Umstieg von SAP BW/4HANA auf SAP Datasphere ist vor allem dann sinnvoll, wenn eine cloud-orientierte Datenstrategie verfolgt wird. Gleiches gilt, wenn sich ein Unternehmen mehr Flexibilität, Offenheit und moderne Analysemöglichkeiten wünscht. Davon abgesehen wird Datasphere in Zukunft die Kernplattform für analytisches Datenmanagement. Dies ist offiziellen Aussagen von SAP zu entnehmen. BW/4HANA wird hingegen keine funktionale Weiterentwicklung mehr erfahren.
Unternehmen, die bereits in BW/4HANA investiert haben, können bestehende Modelle und Datenflüsse schrittweise nach SAP Datasphere übertragen. Realisierbar ist dies mit der SAP BW Bridge, welche die Nutzung von BW-Logik innerhalb von Datasphere ermöglicht.
Ja, SAP Datasphere kann im Rahmen einer kostenlosen 30-Tage-Testversion getestet werden. Der Zugang erfolgt über eine vorkonfigurierte Umgebung (Shared Tenant). Diese ermöglicht es, die wichtigsten Funktionen der Plattform kennenzulernen – darunter die Erstellung von Datenmodellen, die Arbeit mit Beispieldaten und erste Analysefunktionen. Der Zugang zum Test ist über die SAP-Website (Link siehe unten).
Sie planen die Einführung von SAP S/4HANA? Sie möchten professionell und effizient beraten und unterstützt werden?