Definition: Big Data
Der Begriff Big Data bezeichnet allgemein eine große strukturierte sowie unstrukturierte Datenmenge, die Unternehmen in ihren täglichen Geschäftsprozessen produzieren.
Weltweit wird eine unvorstellbare Datenmenge generiert und gespeichert.
Es wird zunehmend schwieriger, größere Datenmengen mit herkömmlicher Technik zu erfassen, analysieren oder zu speichern. Ein weiteres Problem für Unternehmen stellen vor allem die unstrukturierten Datenmengen dar, da diese nur schwer verwertet werden können, aber einen erheblichen Kostenfaktor für Speicherkapazitäten bedeuten.
Big Data steht für
- die immer rasanter wachsenden Datenmengen
- die moderne digitale Technologie (z.B. innovative, leistungsstarke It-Lösungen)
- die Digitalisierung und den damit einhergehenden gesellschaftlichen Wandel
Beispiele für Big Data
Gesammelt werden die Datenmengen auf ganz unterschiedliche Weise. Zu Big Data zählen auf alle Arten erhobene und gespeicherte Datensätze, bis hin zu Ton- und Videoaufzeichnung für die verschiedensten Zwecke. Allgemein wird zwischen strukturierten und unstrukturierten Daten unterschieden:
1. Strukturierte Datenmengen
- Alle Informationen, die sich einordnen lassen
- besitzen ein vorgegebenes Format
- sind leicht zu finden und zu bearbeiten
2. Unstrukturierte Datenmengen
- machen einen erheblichen Teil der Massendaten aus
- Dateityp meist unbekannt
- Inhalt lässt sich nicht explizit zuordnen
- i.d.R. alle im Unternehmen anfallenden Daten (während normaler Geschäftstätigkeit)
Beispiel für unstrukturierte Daten: E-Mail
Hier liegt lediglich eine Grundstrukturierung vor. Absender, Empfänger und Informationen aus dem Briefkopf oder der Signatur sind zwar erkennbar, der eigentliche Inhalt ist jedoch strukturlos.
Die meisten Unternehmensdaten gelten heutzutage als unstrukturiert.
Big Data: Herausforderung für Unternehmen
Für viele Unternehmen stellt sich die Frage, wie diese unzählige Datenmenge verarbeitet werden können und daraus ein verwertbarer Nutzen gezogen werden kann. Um diese rohen Daten zu verarbeiten, wird daher häufig eine Business Intelligence (BI) eingesetzt.