Technischer blog

Big Data: von Daten zu Informationen

Daten: Ursprung und Ziel

Es besteht kein Zweifel, dass Daten eine enorme Quelle des Fortschritts und des Reichtums sind, viele sagen bereits, dass sie das neue Öl sind, der Diamant des 21. Aber für sich genommen sind sie wertlos, sie müssen poliert, veredelt werden, um sie in nützliches und wertvolles Material zu verwandeln, Informationen. Denn obwohl wir sie a priori oft als Synonyme verwenden, sind Daten und Informationen nicht dasselbe.

Daten stellen eine konkrete Tatsache oder einen Umstand dar, losgelöst, ohne Verbindung zu anderen Ereignissen, der nur sich selbst beschreibt und darstellt. Informationen sind jedoch das Ergebnis der Zusammenstellung einer Reihe von Daten, und das ist der Schlüssel, die Verknüpfung von Elementen, die verarbeitet eine Beschreibung eines verständlichen Zusammenhangs bieten, der die Entscheidungsfindung unter der datengesteuerten Philosophie erleichtert. Wie wir sehen, nähren sich Informationen aus Daten, die geformt werden müssen, aber diese müssen zusammengestellt, gesiebt, in Beziehung gesetzt und behandelt werden, um den Nutzen zu erreichen, der sie charakterisiert und von isolierten Datensätzen unterscheidet. Die Reise vom ersten Begriff, von der Quelle, bis zum Endergebnis erfolgt dank Big Data, was nichts anderes ist als die Fähigkeit, große Datenmengen zu analysieren, mit massiven Daten umzugehen, wertvolle Informationen in jeder Umgebung zu bilden, vor allem in der Wirtschaft, wo es um viel Geld geht.

Daten: Ursprung und Ziel

Wir reden über riesige Datenmengen und können uns sicher nicht vorstellen, was das bedeutet. Der Fortschritt und die Verbilligung der Computertechnik haben zu einer unbegrenzten Ausweitung der elektronischen Geräte und der Aktivitäten, die wir mit ihnen durchführen, geführt, was zusammen mit der Universalisierung, der Geschwindigkeit und der hohen Kapazität der Telekommunikation zur Erzeugung von Millionen und Abermillionen von Eingaben pro Sekunde geführt hat.

Heutzutage haben alle Handlungen, die wir nicht nur im beruflichen Umfeld, sondern auch in unserem Alltag ausführen, eine hohe digitale Komponente, derer wir uns vielleicht gar nicht bewusst sind: Wir zahlen mit Kreditkarte, wir versenden E-Mails, wir lassen uns per GPS leiten, wir nutzen soziale Netzwerke, wir kaufen online ein, wir haben immer ein Handy dabei…

Infolgedessen ist das Volumen der verfügbaren Daten exponentiell gewachsen und wird dies auch weiterhin tun, und wir gehen bereits jetzt von sehr auffälligen Mengen aus. Ein Zähler der Aktivität im Netzwerk zeigt an, dass während einer Minute mehr als 500.000 Tweets veröffentlicht werden und mehr als 4 Millionen Suchanfragen auf Google durchgeführt werden. Multipliziert man dies mit den 60 Minuten, die eine Stunde hat, oder den 525.600, die ein Jahr hat, ist das Ergebnis unergründlich. Und dies sind nur einfache und anekdotische Beispiele.

Wie wir sehen, hinterlässt heute fast jede Aktivität ihre Spuren, emittiert Daten, die strukturiert sein können, mit vordefiniertem Format und Umfang, wie z.B. ERP (Enterprise Resource Planning) oder CRM (Customer Relationship Management), oder unstrukturiert, solche, die kein bestimmtes Format haben, wie E-Mails, Sensoren, Bilder, pdf, Social-Media-Inhalte… An dieser Stelle kehren wir zur bereits erwähnten Klassifizierung zurück, denn all diese Datensätze müssen zusammengestellt, verarbeitet und gespeichert werden, also ETL-Prozessen (Extract, Transformation und Load) folgen, um sie in visuelle und intuitive Informationen umzuwandeln, die uns bei den unterschiedlichsten Tätigkeiten helfen: Gesundheit, Kultur, Freizeit, Wissenschaft… aber vor allem im Unternehmensbereich, auf den wir uns konzentrieren.

Um diesen Prozess durchzuführen und die Datenquellen zu kennen, braucht man natürlich Analysetools für ihre Verarbeitung und Fachleute, Data Scientists, die ihre Arbeit tun, um das begehrte Endprodukt zu erhalten: Informationen. Obwohl die Hauptvoraussetzung, um wirklich transformative Ergebnisse zu erzielen, nicht extern, sondern intern ist, eine Änderung der Vision, eine Verschiebung in Richtung der datengetriebenen Philosophie, die die digitale Transformation im gesamten Unternehmen fördert.

Vorteile der Datenanalyse

Unter diesem Prisma der Arbeit, mit Data Science als zentraler Achse, sind die Vorteile zahllos. Wir gehen von weggeworfenen Aufzeichnungen oder Aufzeichnungen, von denen wir nicht einmal wussten, dass sie existieren, dazu über, sie in höchst wertvolles Material für die Unternehmensführung zu verwandeln. Wenn wir die Verarbeitung dieser Daten um künstliche Intelligenz und Business Intelligence erweitern, ist das Potenzial noch größer. Als Ergebnis dieser Symbiose entstehen z.B. Bedarfsprognosesysteme, die noch einen Schritt weiter gehen, indem sie Informationen in die Zukunft projizieren, da sie Absatzprognosen auf X-Zeit-Ansicht liefern und so die Entscheidungsfindung in den Einkaufsabteilungen, der Lagerverwaltung, der Logistik … vereinfachen und die gesamte Lieferkette verbessern.

Das Ziel ist es einen einfachen und intuitiven Blick auf die Realität unserer Verkäufe, die Historie dieser Verkäufe und die Vorhersage des Ausgangs von Referenzen, zu erzeugen. Dies soll in der Folge, den komplexen Entscheidungsprozess vereinfacht. Auf einen Blick soll gesehen werden, welches die meistverkauften Artikel sind und deren Verteilung nach Monaten, Informationen, auf deren Basis die Lagerverwaltungsprozesse optimiert werden, indem sie an den tatsächlichen Bedarf des Unternehmens angepasst werden und Bruch und Überbestände vermieden werden.

Fazit

Der Unterschied zwischen Daten und Informationen beruht auf dem Zusammenhang und der Nützlichkeit. Die Nutzung der riesigen Datenmengen, die wir heute generieren, durch fortschrittliche Analysen ermöglicht es uns, diese in Informationen umzuwandeln, die, auf Dashboards übertragen, jede Geschäftsaktivität vereinfachen. Mit einem Blick auf das entsprechende Dasboard können wir eine Störung in einer Produktionslinie vorhersehen, Transportwege planen, die Produktion optimieren, Lager verwalten, Einkäufe materialisieren … und vieles mehr, was die Abläufe einfacher und effizienter macht und somit Zeit und Geld spart. Darüber hinaus erlaubt uns die Anwendung von künstlicher Intelligenz, nicht in der Vergangenheit zu bleiben, sondern in die Zukunft zu blicken, um zu antizipieren, was passieren wird, was die Entscheidungsfindung, unterstützt durch Daten (datengetriebene Philosophie), einfach und genau macht.