- Sie befinden sich:
- Fachbücher
- »
- Wirtschaft - Unsere Neuheiten
- »
- Management
- »
- Entwicklung von Big-Data-Anwendungen
Management
» weitere Bücher zum Thema
» Buch empfehlen
» Buch bewerten Produktart: Buch
Verlag:
Diplomica Verlag
Imprint der Bedey & Thoms Media GmbH
Hermannstal 119 k, D-22119 Hamburg
E-Mail: info@diplomica.de
Erscheinungsdatum: 05.2022
AuflagenNr.: 1
Seiten: 72
Sprache: Deutsch
Einband: Paperback
Trotz zahlreicher Definitionsversuche ist der Begriff Big Data noch nicht klar umschrieben und galt lange als Modeerscheinung. Möglicherweise ist das Thema Big Data gerade deshalb so populär wie nie zuvor. Zunehmend wird jedoch vergessen, dass Daten ohne einen konkreten Bezug zu einem Kontext wertlos sind. Erst die zielgerichtete Nutzung macht aus Daten eine Information, die einen Nutzen oder Mehrwert generieren kann. Jeder hat Berührungspunkte mit Big Data, ob bewusst oder unbewusst. Das macht die Auseinandersetzung mit Big Data unausweichlich, sowohl für den öffentlichen Sektor, Unternehmen oder Privatpersonen. Ohne Daten von einzelnen Individuen ist aber eine Umsetzung solcher Berechnungen nicht möglich. Es müssen Daten aus sehr persönlichen Lebensbereichen jedes Einzelnen zur Verfügung stehen. Hier muss zugleich ein Schutz der Daten berücksichtigt werden und Regelungen für den Umgang, sowie die Verarbeitung der Daten vorliegen. Wenn diese rechtlichen Aspekte nicht berücksichtigt werden, kann es schnell zu Misstrauen oder Befürchtungen, sowie im schlimmsten Fall zu Datenmissbrauch kommen. Die Datenspeicherung alleine reicht nicht aus, um komplexe Probleme zu lösen und einen Mehrwert zu generieren. Die notwendigen Werkzeuge/Anwendungen müssen vorhanden sein, um aus großen Datenmengen die jeweils gewünschte Information auszulesen. Die Entwicklung und der Einsatz von Big-Data-Anwendungen nimmt somit eine zentrale Rolle beim Thema Big Data ein und wird neben den notwendigen Daten zum Hauptantrieb der Entwicklung. Es ist absehbar, dass Big Data in Zukunft immer wichtiger für die Gesellschaft und Unternehmen sein wird. Dementsprechend wird deutlich, dass Big-Data-Anwendungen gebraucht werden, um gesellschaftliche wie auch wissenschaftliche Fortschritte voranzutreiben. Angesichts der Notwendigkeit von Big-Data-Anwendungen ist es entscheidend, welche Eigenschaften eine gute Big-Data-Anwendung ausmacht und was bei der Entwicklung beachtet werden soll.
Textprobe: Kapitel 2.1.1, Strukturierte Daten: Ein wichtiger Gesichtspunkt bei der Verarbeitung von Daten ist die Art der vorliegenden Daten. Es wird zwischen strukturierten oder unstrukturierten Daten unterschieden. Strukturierte Daten sind aus technischer Sicht in der Regel Daten, die in Tabellen liegen und einen eindeutigen Schlüssel (Primary Key) besitzen. Mithilfe des Primary Keys kann eine bestimmte Information exakt identifiziert werden und muss nur einmal im Gesamtsystem gespeichert werden. Ein Beispiel für strukturierte Daten sind Städtenamen, die in einer Datenbank redundanzfrei in einer eigenen Tabelle gehalten werden und immer wieder anhand des Primary Keys referenziert werden können. Dadurch liegen keine Dopplungen vor und der Datenbestand wird klein gehalten, wodurch die Konsistenz der Datenbank sichergestellt wird. Generell können strukturierte Daten tabellarisch angeordnete Daten, mehrdimensionale Arrays (Matrizen), Zeitreihen mit festen oder variablen Intervallen oder Tabellen mit Daten, die durch Schlüsselspalten untereinander verbunden sind, sein. 2.1.2 Unstrukturierte Daten: Unstrukturierte Daten sind im Vergleich zu strukturierten Daten schwieriger zu definieren. Das Merkmal unstrukturiert ist dann gegeben, wenn Daten keinerlei bzw. nur rudimentären formalen Ordnungskriterien unterliegen. In der Medizin beispielsweise gibt es einfach strukturierte Daten, wie genetische oder klinische Daten. Der größte Teil der medizinischen Daten ist aber unstrukturiert. Das können Texte (Arztbriefe, Notizen in Patientenakten, wissenschaftliche Publikationen), Bilder (Röntgen, Computertomographie (CT)) und Videos (Ultraschall vom Herz oder anderen Organen), Audio (Lungengeräusche, Herztöne), Ergebnisse von molekularen Experimenten von Biopsie-Zellen und viel mehr sein. Geschätzt machen unstrukturierte Daten um die 80% aller Daten in der Medizin aus. Bei vielen unstrukturierten Daten besteht die Möglichkeit, diese in strukturierte Daten umzuwandeln. Im Kontext von relationalen Datenbanken wird der Vorgang, unstrukturierte Daten in eine strukturierte Form zu überführen, als Normalisierung bezeichnet. Wenn im Kontext Big Data von Normalisierung die Rede ist, bezieht sich die Normalisierung auf die strukturierte Speicherung der Daten zur Minimierung der Redundanz und Förderung der Konsistenz. Bei Big-Data-Anwendungen kann es aber durchaus vorteilhaft sein mit unstrukturierten Daten zu arbeiten. Generell ist im Zusammenhang mit Big Data das Speichern von Rohdaten wichtig. Es lohnt sich Rohdaten zu speichern, weil nur selten vorab feststeht, welche Fragen beantwortet werden sollen. Durch möglichst ursprüngliche Daten maximieren sich die Möglichkeiten, neue Einsichten zu gewinnen. Dabei sind unstrukturierte Daten immer ursprünglicher als strukturierte. Die meisten Daten, die im Zusammenhang mit Big Data stehen, sind die sogenannten teilstrukturierten oder semistrukturierten Daten. Das können unter anderem Daten aus Textverarbeitungsprogrammen, PDF-Dateien, E-Mails, Internetseiten (HTML-Dateien) oder Präsentationsdateien sein. Da es bei Big Data jedoch hauptsächlich auf die inhaltlichen Daten ankommt und diese unstrukturiert sind, werden die semistrukturierten Daten im allgemeinen Sprachgebrauch ebenfalls zu den unstrukturierten Daten gezählt. Echte semistrukturierte Daten liegen nur bei Extensible Markup Language (XML)-Dateien und bei Daten aus Tabellenverarbeitungsprogramen vor.