Infrastruktur und Basistechnologien für Big Data
Zielgruppe: | Studierende | |
Programm: | ||
Autor/in: | Simon Prewo | |
Average Workload: | ≈ 3 Hours | |
Course Start: | Flexibel | |
Field of Knowledge: | Enrol |
What can you learn in this course?
- Du kannst den Begriff Big-Data erklären.
- Du kannst die „Macht“ durch Analyse großer Datenmengen erklären.
- Du kannst einschätzen, ob eine Big-Data-Technologie für einen Business Case relevant ist.
- Du kannst teure klassische Datenbanken und wirtschaftliche Big-Data-Technologien kontrastieren.
- Du kannst die Grundsätze bei der Speicherung von Daten bei Big-Data-Technologien erklären (z. Bsp. Optimierung auf einmaliges Schreiben ohne Änderung von Daten).
- Du kannst den Prozess der Beschaffung von Daten am typischen Big-Data-Beispiel von Social-Media-Daten wiedergeben.
Outline
Big-Data: Was ist das?
- Big-Data als Vorgehensweise
- Big-Data definiert durch 3 Vs
Big-Data und Infrastruktur
- Besondere Wichtigkeit von Infrastruktur im Big-Data-Kontext
- Überblick über Big-Data-Technologien
Deep-Dive Technologie: Hadoop
- HDFS
- Technische Implementierung des HDFS
- Map-Reduce
- Hadoops Kernvorteil: "Programm zu den Daten" vs. "Daten zum Programm"
Deep-Dive Technologie: Spark und R on Spark
- Architektur von Spark
- R und Spark auf Hadoop
Einsatzszenarien für Big-Data-Technologien
- Typische Datenquellen für Big-Data
- Vor- und Nachteile von Big-Data-Technologien
Abschluss/ Zertifikat
Confirmation of participation
In diesem Kurs kannst du Badges und ein Weiterbildungszertifikat erhalten.