Predictive Data Science – Blick in die Zukunft mit Apache Spark & Python D 2020

Seminarziel

Daten entstehen überall. Sie werden in der Unternehmenssoftware bereitgestellt, lassen sich aus IoT-Geräten generieren, entstehen in Smartphones, Autos, zuhause. Die Analyse dieser „Big Data“ wird somit immer wichtiger. Dieses Seminar vermittelt die Grundlagen der Datenanalysen und der heute eingesetzten Technologien. Auf Basis von Apache Spark und der Programmiersprache Python werden anhand von umfassenden Echtdaten erste Analysen erstellt.

Seminarinhalt

Predictive Data Science

Im Kurs werden nicht nur die umfangreichen Möglichkeiten vermittelt, mit Datenanalysen Zielbilder für die (mögliche) Zukunft abzuleiten, sondern auch ganz handfeste Basics:

  • Daten im Cluster analysieren mit dem Resilient Distributed Dataset
  • Analysescripte funktional in Python schreiben
  • Umgang mit dem Jupyter Notebook
  • Umgang mit riesigen Echtdaten (Open Data), z.B. Geburtsstatistiken, Taxirouten und Verkehrsdaten
  • Ausblick: Nutzung der Cloud-Infrastruktur für riesige Datenmengen und Künstliche Intelligenz zur Mustererkennung in großen aggregierten Datenmengen

Zielgruppe

Dieses Seminar ist für alle Berufssparten, die mit Datenanalyse umgehen, konzipiert.

Voraussetzungen

Programmierkenntnisse, z.B. in Python, sind von Vorteil, aber nicht notwendig.

Anfrage zu diesem Seminar.

Seminaranfrage

Seminar buchen oder Infos anfordern