100 % förderbar mit Bildungsgutschein
100% Förderung möglich.

Data Scientist – Focus Python

Qualifizierung für die Jobrolle als Data Scientist
Abschlusszertifikat
Fortge­schrittene
Vollzeit/Teilzeit
Deutsch, Englisch
4.990
Kursbeschreibung

Die zertifizierte Online-Weiterbildung zum Data Scientist – Fokus Python befähigt Dich dazu, Prognosemodelle aus Daten abzuleiten, zu verifizieren und zu interpretieren, um die Modellergebnisse effizient zu kommunizieren.

Der zusätzliche Aufbau von Fähigkeiten im Bereich des Machine Learnings qualifiziert Dich mit erfolgreichem Abschluss des Karrierepfades für die Jobrolle als Data Scientist oder eine andere analytische Jobrolle wie dem wie dem Business Intelligence Analyst oder Financial Analyst.

In diesem Training lernst Du
Data Analytics
Machine Learning Basics
Supervised Learning
  • Daten selbständig einlesen, bereinigen und filtern
  • Daten explorativ mithilfe von deskriptiver Statistik analysieren
  • Komplexe Prognosemodelle entwickeln und verifizieren
  • Python-Programmierkenntnisse vertiefen
  • Datenmodelle zur Vorhersage von Businessszenarien bauen
  • Machine-Learning-Algorithmen entwickeln
  • Best Practices für die effektive Datenvisualisierung
  • Methoden des Data Storytellings

Zielgruppe

Die Weiterbildung Data Scientist – Fokus Python eignet sich für alle, die Python als Programmiersprache einsetzen, Daten analysieren und auf Grundlage dieser Vorhersagen erstellen möchten, um datengetriebene Entscheidungen zu treffen. Du solltest eine grundlegende Motivation für Statistik, logisches Denken und maschinelles Lernen mitbringen. Auch für Quereinsteiger:innen ist die Data Scientist Weiterbildung geeignet.

Vorraussetzungen für die Teilnahme

  • Einstufungstest
  • Grundkenntnisse Mathematik, Statistik & Python-Programmierfähigkeiten (inkl. Pandas, Matplotlip)

Module

1
Preparation
toggle

Ziel:
Auffrischung der Kenntnisse im Umgang mit Python sowie mathematischer Grundlagen Beschreibung

Beschreibung:
Teilnehmende führen Analysen und Datenmanipulationen in Python aus und nutzen dabei die Pakete Pandas und Matplotlib.

Kapitel 1 – Data Analytics with Python:
Teilnehmende machen sich mit unserer interaktiven Programmierumgebung – dem Data Lab – vertraut und frischen die wichtigsten Programmier- und Python-Grundlagen zur Datenverarbeitung mit Pandas, Datenvisualisierung mit Matplotlib und Seaborn und Datenbankabfrage mit SQL Alchemy auf.

Kapitel 2 – Linear Algebra:
Teilnehmende machen sich mit dem mathematischen Hintergrund von Data-Science-Algorithmen vertraut und lernen die Grundbegriffe der linearen Algebra kennen. Unter Verwendung des Pakets Numpy rechnen die Teilnehmenden mit Vektoren und Matrizen.

Kapitel 3 – Probability Distributions:
Teilnehmende lernen mehr über den statistischen Hintergrund von Data-Science-Algorithmen. Sie beschäftigen sich mit wichtigen statistischen Konzepten und lernen diskrete und kontinuierliche Verteilungen kennen. Darüber hinaus erhalten Teilnehmende einen Einblick in die Versionierung von Code mit Git.

2
Machine Learning Basics
toggle

Ziel:
Lösen von überwachten und unüberwachten Machine-Learning-Problemen mit sklearn

Beschreibung:
Teilnehmende erstellen Data-Science-Workflows mit sklearn, evaluieren ihre Modell-Performance anhand von geeigneten Metriken und werden für das Problem des Overfittings sensibilisiert.

Kapitel 1 – Supervised Learning (Regression):
Anhand der linearen Regression erlernen Teilnehmende den Umgang mit dem Python-Paket sklearn. Weiterhin beschäftigen sie sich mit den Annahmen des Regressionsmodells und der Evaluation der erzeugten Prognosen. In diesem Zuge werden auch der Bias-Variance Trade-Off, Konzepte der Regularisierung sowie verschiedene Maße der Modellgüte verdeutlicht.

Kapitel 2 – Supervised Learning (Classification):
Teilnehmende werden in Klassifizierungsalgorithmen anhand des k-Nearest-Neighbors-Algorithmus eingeführt und lernen, den Algorithmus zu evaluieren und die Klassifizierungsperformance einzuschätzen. Sie optimieren die Parameter ihres Modells unter Beachtung der Aufteilung der Daten in Trainings- und Evaluationssets.

Kapitel 3 – Unsupervised Learning (Clustering):
Teilnehmende lernen den k-Means-Algorithmus als Beispiel eines Algorithmus des unüberwachten Lernens kennen. Die Annahmen und Performance-Metriken des Algorithmus werden kritisch beleuchtet und ein kurzer Ausblick auf eine Alternative zum k-Means-Clustering geworfen.

Kapitel 4 – Unsupervised Learning (Dimensionality Reduction):
Teilnehmende lernen, wie sie mithilfe einer Principal Component Analysis (PCA) die Dimension der Daten verringern können und nutzen die PCA, um unkorrelierte Features aus den Ursprungsdaten zu erzeugen. In diesem Zusammenhang wird das Thema Feature Engineering näher betrachtet und aus den alten Features neue erzeugt.

Kapitel 5 – Outlier Detection:
Teilnehmende lernen verschiedene Ansätze kennen, um Ausreißer zu identifizieren und verstehen, mit diesen ungewöhnlichen Datenpunkten umzugehen. Sie nutzen robuste Maße und Modelle, um den Einfluss der Ausreißer zu minimieren.

3
Deep Dive Supervised Learning
toggle

Ziel:
Erweiterung des eigenen Data-Science-Toolkits

Beschreibung:
Teilnehmende intensivieren ihre Kenntnisse über Modelle zur Klassifikation von Daten. Dabei erweitern sie ihre Fähigkeiten im Sammeln und Aufbereiten von Daten.

Kapitel 1 – Data Gathering:
Teilnehmende lernen, Daten zu sammeln, indem sie Webseiten und PDFDokumente auslesen. Mithilfe von Regular Expressions strukturieren sie gesammelte Textdaten so, dass sie diese zusammen mit bekannten Algorithmen verwenden können.

Kapitel 2 – Logistic Regression:
Teilnehmende lernen einen zweiten Klassifizierungsalgorithmus kennen: die logistische Regression. Sie nutzen neue Performance-Metriken zur Evaluation der Ergebnisse und erfahren, wie sie nicht-numerische Daten für ihre Modelle nutzbar machen.

Kapitel 3 – Decision Trees and Random Forests:
Teilnehmende lernen den Entscheidungsbaum als leicht zu interpretierendes Modell kennen. Sie kombinieren mehrere Modelle zu einem Ensemble, um die Vorhersagen ihres Modells zu verbessern. Weiterhin erhalten sie Methoden zu unausgeglichenen Kategorien an die Hand.

Kapitel 4 – Support Vector Machines:
Teilnehmende lernen einen letzten Klassifizierungsalgorithmus kennen – Support Vector Machines (SVM) und beleuchten das Verhalten verschiedener Kernel für die SVM. Außerdem erlernen sie die typischen Schritte des Natural Language Processing (NLP) und bearbeiten ein NLPSzenario unter Verwendung von Bag-of-Words-Modellen.

Kapitel 5 – Neural Networks:
Teilnehmende werden in künstliche neuronale Netze eingeführt und lernen mehr über Deep Learning, um ein künstliches neuronales Netzwerk mit mehreren Schichten zu erzeugen und auf ein Datenset anzuwenden.

4
Advanced Topics in Data Science
toggle

Ziel:
Selbstständiges Anwenden einfacher und komplexer Modellierungen

Beschreibung:
Teilnehmende erlangen Souveränität im Lösen von Data-Science-Problemen und lernen, Ergebnisse kompetent zu kommunizieren.

Kapitel 1 – Visualization and Model Interpretation:
Teilnehmende erlernen wichtige Methoden zur Interpretation und Visualisierung von Machine-Learning-Modellen. Durch die Verwendung modelagnostischer Methoden zur Interpretation lernen sie Erkenntnisse zur Funktionsweise ihrer Modelle abzuleiten und zu kommunizieren.

Kapitel 2 – Spark:
Teilnehmende erfahren, weshalb die Arbeit mit verteilten Speichersystemen relevant ist. Mit dem Python-Paket PySpark erlernen sie verteilte Datenbanken auszulesen, Big-Data-Analysen durchzuführen und bekannte Machine-Learning-Algorithmen auf verteilten Systemen zu nutzen.

Kapitel 3 – Exercise Project:
Teilnehmende bearbeiten ein Prädiktionsproblem mit Hilfe eines größeren Datensets und setzen ihre Data-Science-Fähigkeiten von der Reinigung des Datensets bis zur Interpretation des Modells eigenständig ein. In einer Projektbesprechung mit dem Mentorenteam von StackFuel erhalten Teilnehmende Feedback zu ihrem Lösungsansatz.

Kapitel 4 – Final Project:
Teilnehmende erhalten ein weiteres größeres Datenset, das sie selbstständig analysieren und im Vergleich zum Übungsprojekt mit weniger Hilfestellungen lösen müssen. In einer individuellen Projektbesprechung mit dem Mentoring Team von StackFuel erhalten Teilnehmende Feedback zu ihrem Lösungsansatz.

FAQ

Der Bedarf an Data Expert:innen ist hoch. Bis 2025 werden rund 4 Millionen Datenexpert:innen in Europa benötigt. Allein in Deutschland sind derzeit 149.000 IT-Jobs unbesetzt. Vor allem die Nachfrage nach Daten- und KI-Experten nimmt weiterhin enorm zu.

Aber eine Entscheidung für eine Daten-Karriere ist noch so viel mehr als nur eine sichere Zukunftsentscheidung! Als Datenexpert:in beschäftigst Du Dich mit starken, gesellschaftlich relevanten Themen, bist gleichzeitig Tech-Profi und kommunikativ und kreativ. Der Beruf ist abwechslungsreich, lässt sich mit den meisten anderen Berufen kombinieren und bietet ein attraktives Gehalt. Und das Wichtigste: Er ist mit uns zielsicher erlernbar!

Ja, nach erfolgreichem Abschluss der Weiterbildung erhältst Du ein Abschlusszertifikat von uns, dass Du bei Deinen Bewerbungen vorzeigen kannst. Data Analysts und Data Scientists werden in vielen Wirtschaftsbereichen händeringend gesucht. Selbst ohne einschlägige Berufserfahrungen stehen Deine Chancen auf einen Einstiegsjob also gut. Dazu kommt, dass es in fast jeder Branche Analysten gibt, diese haben dann zwar unterschiedliche Jobtitel, aber die Fähigkeiten, die Du dazu brauchst, sind dieselben, wie die des Data Analyst oder Data Scientist.
Ja, unsere Online-Weiterbildungen sollen Dir die größtmögliche Flexibilität bieten. Grundsätzlich empfehlen wir sechs bis acht Stunden pro Woche zum Lernen einzuplanen. Wann Du diese Zeit einplanen willst, liegt bei Dir und wird von uns nicht vorgeschrieben. In unseren Karrierepfaden, dem Data Analyst und Data Scientist Kurs, bieten wir Dir Live-Webinare, in denen Du unseren Mentor:innen Fragen stellen kannst, an denen Du aber nicht teilnehmen musst, wenn es nicht in Deinen Zeitplan passt.
quotation_marks
testemonial_picture_
Das Data Lab von StackFuel bietet für mich einen echten Mehrwert. Hier spürt man den Praxisbezug besonders gut. Die Aufgaben waren immer klar beschrieben und anschaulich dargestellt. So wusste ich immer, was ich machen muss. Das Training an sich war eine großartige Erfahrung!
Alexander Gross
Data Analyst bei AIC Portaltechnik
quotation_marks_flipped
quotation_marks
testemonial_picture_
Den größten Mehrwert bietet für mich der Praxisbezug. Dank StackFuel kann ich das Erlernte schnell umsetzen und für mich adaptieren. Das ist der echte Lernerfolg hinter den Online-Trainings.
Lutz Schneider
Strategischer IT-Einkäufer bei Axel Springer SE
quotation_marks_flipped
quotation_marks
testemonial_picture_
Die Inhalte des Online-Trainings von StackFuel waren sehr praxisorientiert. Es gab viele gute Beispiele und Projekte. Das fand ich sehr interessant und lehrreich. Seit dem Training hat sich mein Berufsalltag maßgeblich verändert: Ich bin jetzt Fachreferent für Datenanalysen in meiner Abteilung.
Jaroslaw Wojciech Sulak
Fachreferent für Datenanalysen bei IAV GmbH
quotation_marks_flipped
quotation_marks
testemonial_picture_
Die anwendungsfreundliche und flexible Weiterbildung Python-Programmierung hat meinen Blick auf komplexe Datenstrukturen komplett verändert. Dank des nachhaltigen und gut durchdachten Lernkonzepts sowie der nahtlosen Anwendung der Lerninhalte in der Entwicklungsumgebung kann ich das neu erlernte Wissen jetzt in meinem Joballtag vertieft in der Testautomation umsetzen und Daten seitdem leichter und effizienter verarbeiten.
Jenny Lindenau
Fachliche Leitung Testmanagement bei Bank Deutsches Kraftfahrzeuggewerbe GmbH
quotation_marks_flipped

Lass uns starten mit einer Beratung.

Unsere Beraterinnen und Berater helfen Dir gerne weiter und beantworten Dir alle offenen Fragen. Kostenlos und unverbindlich. Wir freuen uns auf Dich.
4.990*
(inkl. MwSt.)
0 € mit Bildungsgutschein