Zum Inhalt springen

Wann sollten Unternehmen in einen Data Lake (Datensee) investieren?

Datensee

In diesem Blogartikel geht es darum, wann Unternehmen in einen Data Lake (Datensee) investieren sollten?

Data Lake Definition

Auf wikipedia steht folgendes bzgl. Data Lake:

“Wertvolle Kundenerlebnisse lassen sich nur auf der Grundlage der detaillierten Kenntnis der Kundenbedürfnisse generieren. Dafür gilt es zunächst, die bereits im Unternehmen vorhandenen kontextrelevanten Daten zu mobilisieren und entlang des Kundenprozesses zusammenzuführen bzw. zu integrieren. Für eine umfassende und zeitnahe Nutzung müssen diese vollumfänglich als dispositive Daten verfügbar sein. Die SDA ermöglicht den schrittweisen Aufbau dispositiver Datenbestände, die dann, unabhängig vom operativen Betrieb, analysiert und genutzt werden können.”
(Quelle: wikipedia)

Es ist mittlerweile kein Geheimnis mehr, dass das digitale Universum, das die Datenanforderungen der meisten Unternehmen umfasst, exponentiell wächst. Tatsache ist auch, dass die meisten Unternehmen zu wenig bis gar keinen Mehrwert aus diesen Daten generieren.

In diesem Umfeld ist es von entscheidender Bedeutung, dass Unternehmen Datenanalysen einsetzen, um die Wettbewerbsfähigkeit zu steigern und die Anforderungen der “Informationsgenerierung” zu erfüllen. Das speichern und analysieren unternehmensweiter Daten ermöglicht beispielsweise Vorhersagen des Kaufverhaltens, die Verbesserung des Kundenservice oder die Steigerung der Produktivität in den verschiedenen Unternehmensbereichen. Big Data Analysen sollten kein Anspruch mehr sein, sondern eine Notwendigkeit. Bereits heute existieren Werkzeuge für die parallele Verarbeitung großer Datenmengen und KI-basierte Technologien, wie z.B. Maschinelles Lernen, Deep Learning, NLP – Natural Language Processing etc., die die hocheffiziente Analyse von Unternehmensdaten ermöglichen.

Viele Organisationen bleiben jedoch früh auf der Reise stecken. Einer der Hauptgründe dafür ist, dass die IT und der Rest des Unternehmens nicht immer auf die besten Anwendungsfälle und Geschäftsziele von Big Data-Projekten ausgerichtet sind. Während einige Unternehmen mit grundlegenden Datenanalysen experimentieren (und einige noch nicht einmal damit begonnen haben), sind viele einfach nicht auf die nächste Ebene vorbereitet, die viel komplexer und detaillierter ist.

Woher weiß ein Unternehmen, wann es in einen Data Lake (Datensee) investieren muß?

Es gibt vier verräterische Anzeichen:

Operative Komplexität

Wenn ein Unternehmen versucht, seine Infrastruktur zu skalieren, aber keine Option auf zusätzliche FTE-Unterstützung (Vollbeschäftigtenäquivalent) hat, besteht in einer Pre Data Lake Umgebung eine große Wahrscheinlichkeit, dass die Datenanforderungen die Fähigkeit des Unternehmens übersteigen, sie zu verwalten. Traditionelle 1-Tier Datenressourcen werden nicht immer virtuell gepoolt, was die Speichermenge einschränkt, mit der ein einzelner Verwalter umgehen kann und somit ein klares Argument für eine flexiblere gemeinsame Speicherressource, d.h. einen Datensee, darstellt.

Betriebskosten

Wenn ein Unternehmen feststellt, dass die geschäftlichen Anforderungen an die IT auch dann weiter steigen, wenn es versucht, die Betriebskosten zu senken, dann ist es an der Zeit einen neuen Ansatz zu betrachten. Die gleichen operativen Gemeinkosten, die die Möglichkeit für zusätzliche FTEs einschränken, führen auch zu wachsenden Betriebskosten für die Verwaltung von IT-Ressourcen. Um diese Anforderungen zu erfüllen, benötigen Unternehmen entweder mehr FTEs oder müssen zusätzlichen in den Support von Drittanbietern investieren, um ihre Systeme zu überwachen, zu verwalten, bereitzustellen und zu verbessern. Der letztgenannte Ansatz skaliert eine Größenordnung besser – oder mehr – als einfach nur den Personalbestand zu erhöhen.

Produktionsstamm

Ein weiterer wichtiger Indikator für die Notwendigkeit eines Datensees ist, wenn bestehende Analyseanwendungen die Produktionssysteme eines Unternehmens belasten. Echtzeitanalysen können äußerst ressourcenintensiv sein und dies unabhängig davon, ob man beispielsweise durch Videoanalysen HD-Videostreams Einblicke gewinnen möchte oder durch einen riesigen Strom von Inhalten surft. Es sind dedizierte Ressourcen erforderlich, damit die Anwender bei der Nutzung der Produktionssysteme nicht ausgebremst werden. Datenlöcher sind der Schlüssel, um sicherzustellen, dass Echtzeitanalysen mit optimaler Leistung ausgeführt werden können.

Multiprotokoll-Analysen

Ein endgültiger Schlüsselindikator dafür, dass ein Unternehmen einen Datensee benötigt, ist, wenn Datenwissenschaftler Apps auf einer Vielzahl verschiedener Hadoop-Distributionen ausführen und ihre Daten an diese anhängen müssen. Unternehmen benötigen künftig Multiprotokoll-Unterstützung, wenn Datenanalysen ausgebaut sollen und sie müssen dies mit einer Datensee Strategie planen.

Abteilungen wie das Marketing haben bei der Einführung von Big Data Analysen eine Vorreiterrolle übernommen. Um ihre Kunden besser zu verstehen, haben sie die gewonnen Erkenntnisse aus den Analysen  genutzt und ihre Kommunikation entsprechend optimiert. Aber auch andere Geschäftsbereiche von HR über IT bis hin zu Unternehmensplanung und darüber hinaus interessieren sich jetzt für die Vorteile von Big Data Analysen.

Von der Finanzbranche über den Einzelhandel, die Fertigung bis hin zu Medienunternehmen wird branchenübergreifend angenommen, dass ihre Probleme, Herausforderungen und Chancen einzigartig sind. Aber wenn Sie die Einzelheiten abstrahieren, kommt man immer wieder zu denselben universellen Herausforderungen zurück, die in diesem Artikel erwähnt wurden. All das vereint und charakterisiert die Transformation durch die Informationstechnologie und das Potenzial von Big Data Analytics.

Nicht jedes Unternehmen wird bereit sein, Analysen von großen Datenmengen durchzuführen. Aber die meisten werden zumindest mit der Planung anfangen müssen. Ansonsten riskiert man Kunden an die Konkurrenz zu verlieren, da diese die neuen Analysemöglichkeiten bereits einsetzen.

Unternehmen sollten sich die Möglichkeiten der Big Data Analysen und insbesondere  maschinelles Lernen zu eigen machen, um aus ihren eigenen Daten einen Mehrwert zu generieren. Diejenigen Unternehmen, die dies aktuell nicht einmal planen, werden im Zeitalter der Digitalisierung ihre Marktstellung nicht mehr behaupten können.

Haben Sie noch Fragen? Sprechen Sie uns an: info@aisoma.de

Ihr AISOMA Team

Lesen Sie auch unseren Artikel zum Thema
Wie Data First die Herstellung von Software grundlegend verändert