Vorteile von Datenplattformen auf Azure| Infopulse
Data Platforms on Azure [banner]
Zurück

Aufbau moderner Datenplattformen auf Microsoft Azure – Vorteile und Anwendungsfälle

Willkommen zurück zu unserer Artikelserie über moderne Datenplattformen. Bisher  haben wir beschrieben, warum es unerlässlich ist, cloudbasierte Datenplattformen aufzubauen, und kurz die Toolkits der drei bekanntesten Cloud-Service-Anbieter – Microsoft, AWS und Google, besprochen.  

In diesem Teil werden wir die wichtigsten Vorteile des Microsoft Azure-Toolkits erläutern, dessen primäre Datenspeicher-, Verwaltungs- und Analyselösungen vorstellen und praktische Beispiele für den Aufbau zukunftssicherer Datenplattformen auf der Basis von Azure aufzeigen.

Vorteile des Aufbaus von Datenplattformen auf Microsoft Azure

Microsoft Azure ist eine umfangreiche Cloud-Plattform, die verschiedene SaaS-, PaaS- und IaaS-Modelle bietet und eine Reihe von Programmiersprachen, Software-Tools und Frameworks unterstützt. In Azure finden Sie ein breites Spektrum an End-to-End-Cloud-Diensten:

  • Datenspeicherung und -verwaltung
  • Verarbeitung in Echtzeit
  • Erweiterte Business Intelligence
  • KI/ML-Fähigkeiten der nächsten Generation.

Das Azure-Toolkit eignet sich für die Entwicklung von Datenplattformen jeglicher Komplexität, vom einfachen DWH bis hin zu stabilen Plattformen, die jede Art von Daten konsolidieren und verarbeiten können, inklusive strukturierter, halbstrukturierter, unstrukturierter und sich schnell bewegender Streaming-Daten.

Was Azure von anderen Cloud-Anbietern abhebt, ist seine ultimative Flexibilität. Die Unternehmen haben Zugriff auf ein riesiges Angebot an Produkten und Diensten und können diese als Bausteine nutzen, um die perfekte Datenplattform-Architektur zu erstellen. Benutzer können nach Bedarf jeden Dienst oder jede Arbeitslast hinzufügen, entfernen und skalieren, was jegliche zusätzliche Kosten vermeidet. Darüber hinaus ist es nicht erforderlich, in den Aufbau, die Verwaltung und die Wartung einer zugrunde liegenden Infrastruktur zu investieren, da Azure eine vollständig verwaltete Cloud-Plattform mit serverlosen Computing-Funktionen ist.

Ein weiterer großer Vorteil des Azure-Toolkits für Unternehmen ist die Einbindung in das ganzheitliche Microsoft-Ökosystem und die ständige technologische Weiterentwicklung. Datenplattformen auf der Basis von Azure lassen sich nahtlos mit Microsoft-spezifischer Software oder Software von Drittanbietern integrieren, um so Daten in hybriden Umgebungen zu sammeln, Datenflüsse zu orchestrieren und zu überwachen, ETL-Prozesse zu automatisieren und Big Data-Analysen zu ermöglichen. Angesichts der Tatsache, dass Daten ein unabdingbares Geschäftsgut sind und Entscheidungen mit der Geschwindigkeit des menschlichen Denkens getroffen werden müssen, fügt Microsoft Azure ständig neue nützliche Funktionen hinzu. Ungeachtet ständiger Innovationen und Veränderungen bleibt Microsoft für die meisten Benutzer ein vertrautes Ökosystem, was die Schwelle für den Erwerb entsprechender Kenntnisse senkt und die TCO-Kosten für Unternehmen reduziert.  

Allerdings kann die Erstellung einer benutzerdefinierten Datenplattform mit einem so umfangreichen Portfolio an Microsoft-Produkten und -Diensten zu einer großen Herausforderung werden. Infopulse ist ein Azure Expert MSP und Microsoft Gold Partner mit zahlreichen Azure Advanced-Spezialisierungen und bietet die umfassendste Suite von Azure-Cloud-Services und -Lösungen an, einschließlich der Entwicklung moderner Datenplattformen, die auf folgenden hochmodernen Microsoft-Tools basieren.  

Ausführlicher Überblick über das Azure-Toolkit

Azure Synapse Analytics ist ein unternehmensweit einheitlicher Analysedienst, mit dem Daten aus verschiedenen DWHs und Big-Data-Systemen konsolidiert, verarbeitet und verwaltet und schnell für Business Intelligence-Anforderungen bereitgestellt werden können. Es ermöglicht die Abfrage sowohl relationaler als auch nichtrelationaler Daten unter Verwendung der bevorzugten Programmiersprache. Azure Synapse lässt sich nahtlos in Apache Spark (eine der beliebtesten Big Data-Engines) integrieren, wodurch die Prozesse der Datenaufbereitung, des Engineering und der ETL vereinfacht werden. Zudem lässt sich der Service mit Apache ML und Azure ML verknüpfen, um Machine Learning-Modelle für Data Warehousing und prädiktive Analysen zu erstellen.  

Mit Azure Synapse und Azure Databricks, einem Big-Data-Analysedienst, lässt sich in wenigen Minuten eine Apache Spark-Umgebung einrichten, Datencluster einfach aufbauen und konfigurieren, benutzerdefinierte ML-Modelle erstellen und auf einen gemeinsamen Arbeitsbereich zugreifen, der Python, Scala, R und SQL unterstützt.    

Azure Datenspeicherung & Analyse-Tools
scheme-1-aufbau-moderner-datenplattformen-auf-microsoft-azure

      

Azure Data Factory ist eine vollständig verwaltete, serverlose Datenintegrationsdienstleistung, die die Aufnahme, Orchestrierung und Umwandlung von Rohdaten aus verschiedenen Quellen in großem Umfang ermöglicht. Es bietet 90 integrierte Konnektoren zur Datenerfassung aus SaaS-Anwendungen (ServiceNow, Salesforce), Unternehmensdatenbanken (Oracle Exadata, Teradata), Big Data-Diensten (Amazon S3, Google BigQuery) und allen Azure-Diensten. Mit Azure Data Factory lassen sich auf einfache Weise komplexe ETL- und ELT-Pipelines erstellen und die Daten an Azure Synapse liefern, um wertvolle Geschäftseinblicke zu gewinnen oder sie in Data Lakes zu speichern.  

Azure Stream Analytics gehört zu den unverzichtbaren Echtzeitanalysetools, die Sie beim Umgang mit schnell strömenden Daten aus zahlreichen Quellen gleichzeitig unterstützen können. Wenn die Daten in großen Mengen von mehreren IoT-Geräten, Webprotokollen, Clickstreams, GIS usw. stammen, ist die Produktivität der Datenplattform stark von den Fähigkeiten dieser Engine abhängig.  

Azure Data Lake Storage – ein hoch skalierbares und flexibles Repository, das die Speicherung und Analyse von Daten im Petabyte-Bereich aus allen möglichen heterogenen Quellen ermöglicht. Mit Azure Data Lake Storage haben Sie die nötige Grundlage für Big Data-Analysen und können so den Wert all Ihrer Datenressourcen freisetzen.  

Ein Praxisbeispiel: Ein weltweit tätiges Wirtschaftsprüfungsunternehmen hat nach der Implementierung von Azure Data Lake und Data Bricks mit Unterstützung von Infopulse die Datenextraktion und -verarbeitung optimiert und gleichzeitig die Entwicklung und Bereitstellung von Vorhersagemodellen beschleunigt.  

Power BI ist eine auf Azure basierende Business Intelligence-Plattform, die eine Vielzahl von fortschrittlichen Datenanalyse-, Verwaltungs- und Berichtstools kombiniert. Die Plattform fasst Rohdaten aus beliebigen Quellen zusammen, von Excel-Tabellen bis zu komplexen hybriden DWHs, und wandelt sie mithilfe umfangreicher Visualisierungs- und Anpassungsoptionen in aufschlussreiche Berichte um. Mit den integrierten KI-Funktionen, den benutzerdefinierten Konnektoren, den Self-Service-Analysen, den praktischen Drag-and-Drop-Funktionen, den Echtzeit-Stream-Analysen und vielem mehr kann Power BI als zentrale Anlaufstelle für den Datenbedarf von Unternehmen aus verschiedenen Branchen dienen.  

Azure-basierte Datenplattformen im Einsatz: Anwendungsfälle von Infopulse

Die Umwandlung eines Azure-basierten DWH in eine moderne Datenplattform für eine große Agro-Holding

Ein großer internationaler Agro-Industriekonzern, unser langjähriger Kunde, hat mehrere groß angelegte digitale Transformationsprojekte initiiert, um seine Geschäftsprozesse zu modernisieren und die Entscheidungsfindung zu verbessern. Das erste Projekt umfasste die Ablösung eines alten Datenmanagementsystems durch eine fortschrittliche DWH-Lösung, um die folgenden Herausforderungen zu bewältigen:

  • Die Zentralisierung der verstreuten alten Berichtslösungen in einer einzigen Plattform
  • Einen Weg zu einer schnelleren und effizienteren Berichterstattung sowie zu intelligenten Analysen
  • Unterstützung der Unternehmensentwicklung mit einer skalierbaren Lösung

Infopulse konzipierte und implementierte eine auf Microsoft Azure basierende, flexible DWH-Lösung. Das DWH umfasste Azure Synapse Analytics, das ETL-Operationen durchführte, Azure SQL Elastic Pools für die Datenverwaltung und Power BI, um Daten zu visualisieren und individuelle Berichte zu erstellen. Infolgedessen half das neue DWH dem Kunden, die Leistung der internen Systeme zu optimieren, die bestehenden Datensilos zu überbrücken und verwertbare Erkenntnisse zu gewinnen.

Azure-basierte DWH-Architektur für die Agro-Holding
scheme-2-aufbau-moderner-datenplattformen-auf-microsoft-azure

   

In dieser Fallstudie finden Sie einen detaillierten Überblick über das Azure-basierte DWH, einschließlich einer vollständigen Liste seiner Funktionen und seines Geschäftswerts.  

Folglich begann der Datenbedarf der agro-industriellen Holding exponentiell anzusteigen. Als nächstes Strategieziel wollte der Kunde die Echtzeitanalyse schnell fließender Datenströme aus einem großen Ökosystem von IoT-Geräten ermöglichen.

Um dem Kunden zu helfen, die gewünschten Ergebnisse zu erzielen, entwickelte Infopulse eine brandneue Lösungsarchitektur und transformierte das bestehende DWH nahtlos in eine moderne Azure-Datenplattform, ohne die Geschäftskontinuität des Unternehmens zu beeinträchtigen. Heute betreibt unser Kunde eine hochmoderne Datenplattform, die enorme Mengen an strukturierten und unstrukturierten Daten sowie IoT-Daten schnell aufnehmen und verarbeiten kann.

Die Architektur der brandneuen Datenplattform
scheme-3-aufbau-moderner-datenplattformen-auf-microsoft-azure

     

Die gesamten Daten des Kunden werden in nahezu unbegrenzten Speicher übertragen, der von Azure Data Lake bereitgestellt wird. Zudem dient der Data Lake als Grundlage für die Erstellung und den Einsatz von prädiktiven ML-Modellen.

Delta Lake-basierte Datenplattform für einen großen Hersteller von Verpackungen und Behältern

Bei unserem Kunden handelt es sich um eines der führenden Unternehmen im Bereich der Herstellung von Wellpappe, Verpackungslösungen und Papierrecycling in Europa. Die Geschäftseinheiten des Kunden sind über 10 Länder in der EU verteilt. Für jede dieser Einheiten gelten spezifische lokale Vorschriften und Lieferkettenabläufe sowie verstreute Systeme zur Datenerfassung, Verwaltung und Berichterstattung. Das zentrale Ziel des Kunden war es, alle Datenoperationen auf kosteneffiziente Weise zu zentralisieren.

Infopulse verfügt über mehr als 10 Jahre Erfahrung in den Bereichen Data Lake und Big Data-Dienste und hat eine fortschrittliche Unternehmensdatenplattform auf der Grundlage der Delta Lake-Technologie entwickelt. Delta Lake ist eine Datenspeicher- und Verwaltungsschicht, die auf einem Data Lake aufbaut. Die kundenspezifische Azure-Datenplattform beinhaltet Azure Data Lake Storage Gen2, in dem alle Arten von Daten aus verschiedenen Umgebungen gesammelt werden, und Azure Data Bricks dient der Konsolidierung, Umwandlung und Berechnung der Datenmenge. Folglich ermöglicht es Echtzeitanalysen der gesammelten Daten, die von Power BI bereitgestellt werden.

Azure Databricks Delta Lake Architecture
scheme-4-aufbau-moderner-datenplattformen-auf-microsoft-azure

Das Ergebnis war, dass unser Kunde durch die Implementierung der modernen unternehmensgerechten Datenplattform von folgenden Vorteilen profitierte:

  • Einführung einer verlässlichen Single Source of Truth, welche die Daten über das gesamte Geschäftssystem des Kunden hinweg konsolidiert
  • Optimiertes Datenmanagement und präzise Analysen über alle Phasen des Produktlebenszyklus hinweg, einschließlich Produktion, Beschaffung und Vertrieb
  • Automatisierte Berechnungen der wichtigsten Metriken der Lieferkette
  • Umfassende Datenvisualisierungs- und Berichtsfunktionen für alle Unternehmensebenen – von Produktionsanalysen für jede Einheit bis hin zu detaillierten strategischen Dashboards für den Vorstand.

Fazit

Microsoft Azure ist eine hervorragende Option für den Aufbau moderner Datenplattformen, da das ganzheitliche Ökosystem aus hochmodernen Tools Ihren Datenbedarf von A bis Z abdecken kann. Am wichtigsten ist jedoch, dass die Flexibilität von Azure es erlaubt, Ihre Datenplattform schrittweise aufzubauen, zu integrieren und zu erweitern, um die erforderlichen Geschäftsziele zu erreichen, und dabei nur für das zu zahlen, was Sie nutzen.

Als erfahrener Anbieter von Datenverwaltungsdiensten unterstützt Infopulse Sie bei der Entscheidungsfindung und der optimalen Nutzung Ihrer Daten. Wenn Sie eine leistungsstarke, intelligente und sichere Datenplattform aufbauen möchten, die auf den grenzenlosen Möglichkeiten von Microsoft Azure basiert, nehmen Sie Kontakt mit uns auf. 

Datenplattform auf Azure

Kontaktieren Sie uns, wenn Sie eine leistungsstarke, intelligente und sichere Datenplattform aufbauen möchten, die auf den grenzenlosen Möglichkeiten von Microsoft Azure basiert.

Lass uns reden

Über den Autor

Serhii Kovalenko has over 15 years of experience in the IT industry, managing projects and deliveries of various complexity across retail, oil & mining, agricultural, banking, insurance, and telecom domains. His expertise focuses on data management & BI, particularly on cloud solution adoption on Microsoft, AWS, GCP, etc. Moreover, he has good practical experience of implementing CRM and identity management systems, as well as developing bespoke mobile- and web-based solutions.
Serhii Kovalenko

Serhii Kovalenko

Engagement Manager

Weitere Artikel

Wir haben eine Lösung für Ihre Anforderungen. Senden Sie uns einfach eine Nachricht, und unsere Experten werden sich so schnell wie möglich mit Ihnen in Verbindung setzen.

Vielen Dank!

Wir haben Ihre Anfrage erhalten und werden Sie in Kürze kontaktieren.