Modul

Data Science.

Lerne fortgeschrittene Datenskills wie Datenmodellierung  und Machine Learning.

Modulbeschreibung

9 Wochen Vollzeit / 18 Wochen Teilzeit

DE & EN

Im zertifizierten Data Science-Modul lernst Du die Grundlagen des Machine Learnings, der Technologie, die moderner KI zugrunde liegt. Du lernst, Datenmodelle mit Python zur Vorhersage von unterschiedlichen Businessszenarien umzusetzen. Du entwickelst die Fähigkeit, überwachte und unüberwachte Machine-Learning Algorithmen zu nutzen und zu optimieren.

Durch praxisbezogene Anwendungsbeispiele erlangst Du Souveränität im Lösen von Data Science-Problemen. Das Data Science-Modul schließt Du mit einem Abschlussprojekt ab, in dem Du ein größeres Datenset zur Vorhersage von Autokäufen selbstständig analysierst und löst. Der zusätzliche Aufbau von Fähigkeiten im Bereich des Machine Learnings qualifiziert Dich mit erfolgreichem Abschluss für die Jobrolle als Data Scientist, zusätzlich zu weiteren analytischen Jobrollen wie dem Data Analyst, Business Intelligence Analyst oder Financial Analyst.

In diesem Modul lernst Du:

Machine Learning-Grundlagen

Supervised Learning

Unsupervised Learning

Daten selbständig einlesen, bereinigen und filtern
Daten explorativ mithilfe von deskriptiver Statistik analysieren
Komplexe Prognosemodelle entwickeln und verifizieren
Python-Programmierkenntnisse vertiefen
Datenmodelle zur Vorhersage von Businessszenarien bauen
Machine-Learning für Vorhersagen nutzen
Best Practices für die effektive Datenvisualisierung anwenden
Methoden des Data Storytellings anwenden

Inhaltsübersicht

1
Preparation

Kapitel 1: Data Analytics with Python

Du frischst die wichtigsten Python-Grundlagen zur Datenverarbeitung mit Pandas, Datenvisualisierung mit Matplotlib und Seaborn und Datenbankabfrage mit SQL Alchemy auf.

Kapitel 2: Lineare Algebra

Du machst Dich mit dem mathematischen Hintergrund von Data-Science-Algorithmen vertraut und lernst die Grundbegriffe der linearen Algebra kennen. Unter Verwendung des Pakets Numpy rechnest Du mit Vektoren und Matrizen.

Kapitel 3: Probability Distributions

Du lernst mehr über den statistischen Hintergrund von Data-Science-Algorithmen. Du beschäftigst Dich mit wichtigen statistischen Konzepten und lernst diskrete und kontinuierliche Verteilungen kennen. Darüber hinaus erhältst Du einen Einblick in die Versionierung von Code mit Git.

2
Machine Learning Basics

Kapitel 1: Supervised Learning (Regression)

Anhand der linearen Regression erlernst Du den Umgang mit dem Python-Paket sklearn. Weiterhin beschäftigst Du Dich mit den Annahmen des Regressionsmodells und der Evaluation der erzeugten Prognosen. In diesem Zuge werden auch der Bias-Variance Trade-Off, Konzepte der Regularisierung sowie verschiedene Maße der Modellgüte verdeutlicht.

Kapitel 2: Supervised Learning (Classification)

Du wirst in Klassifizierungsalgorithmen anhand des k-Nearest-Neighbors-Algorithmus eingeführt und lernst, den Algorithmus zu evaluieren und die Klassifizierungsperformance einzuschätzen. Du optimierst die Parameter von Modellen unter Beachtung der Aufteilung der Daten in Trainings- und Evaluationssets.

Kapitel 3: Unsupervised Learning (Clustering)

Du lernst den k-Means-Algorithmus als Beispiel eines Algorithmus des unüberwachten Lernens kennen. Die Annahmen und Performance-Metriken des Algorithmus werden kritisch beleuchtet und ein kurzer Ausblick auf eine Alternative zum k-Means-Clustering geworfen.

Kapitel 4: Unsupervised Learning (Dimensionality Reduction)

Du lernst, wie Du mithilfe einer Principal Component Analysis (PCA) die Dimension der Daten verringern kannst und nutzt die PCA, um unkorrelierte Features aus den Ursprungsdaten zu erzeugen. In diesem Zusammenhang wird das Thema Feature Engineering näher betrachtet und aus den alten Features neue erzeugt.

Kapitel 5: Outlier Detection

Du lernst verschiedene Ansätze kennen, um Ausreißer zu identifizieren und verstehst, mit diesen ungewöhnlichen Datenpunkten umzugehen. Du nutzt robuste Maße und Modelle, um den Einfluss der Ausreißer zu minimieren.

3
Supervised Learning

Kapitel 1: Data Gathering

Du lernst, mit Tools wie BeautifulSoup für Web Scraping und PyPDF2 für die PDF-Datenextraktion Daten zu sammeln. Mithilfe von Regular Expressions strukturierst Du gesammelte Textdaten so, dass diese zusammen mit bekannten Algorithmen verwenden können.

Kapitel 2: Logistic Regression

Du lernst einen zweiten Klassifizierungsalgorithmus kennen: die logistische Regression. Du nutzt neue Performance-Metriken zur Evaluation der Ergebnisse und erfährst, wie Du nicht-numerische Daten für Deine Modelle nutzbar machst.

Kapitel 3: Decision Trees and Random Forests

Du lernst den Entscheidungsbaum als leicht zu interpretierendes Modell kennen. Du kombinierst mehrere Modelle zu einem Ensemble, um die Vorhersagen Deines Modells zu verbessern. Weiterhin erhältst Du Methoden zu unausgeglichenen Kategorien an die Hand.

Kapitel 4: Support Vector Machines

Du lernst einen letzten Klassifizierungsalgorithmus kennen – Support Vector Machines (SVM) und beleuchtest das Verhalten verschiedener Kernel für die SVM. Außerdem erlernst Du die typischen Schritte des Natural Language Processing (NLP) und bearbeitest ein NLP-Szenario unter Verwendung von Bag-of-Words-Modellen.

Kapitel 5: Neural Networks

Du wirst in künstliche neuronale Netze eingeführt und lernst mehr über Deep Learning, um ein künstliches neuronales Netzwerk mit mehreren Schichten zu erzeugen und auf ein Datenset anzuwenden.

4
Advanced Topics

Kapitel 1: Visualization and Model Interpretation

Du erlernst wichtige Methoden zur Interpretation und Visualisierung von Machine-Learning-Modellen. Durch die Verwendung modelagnostischer Methoden zur Interpretation lernst Du, Erkenntnisse zur Funktionsweise Deiner Modelle abzuleiten und zu kommunizieren.

Kapitel 2: Spark

Du erfährst, weshalb die Arbeit mit verteilten Speichersystemen relevant ist. Mit dem Python-Paket PySpark erlernst Du verteilte Datenbanken auszulesen, Big-Data-Analysen durchzuführen und bekannte Machine-Learning-Algorithmen auf verteilten Systemen zu nutzen.

Kapitel 3: Übungsprojekt

Du bearbeitest ein Prädiktionsproblem mit Hilfe eines größeren Datensets und setzt Deine Data-Science-Fähigkeiten von der Reinigung des Datensets bis zur Interpretation des Modells eigenständig ein. In einer Projektbesprechung mit dem Mentoring-Team von StackFuel erhältst Du Feedback zu Deinem Lösungsansatz.

Kapitel 4: Abschlussprojekt

Du erhältst ein weiteres größeres Datenset, das Du selbstständig analysieren und im Vergleich zum Übungsprojekt mit weniger Hilfestellung lösen musst. In einer individuellen Projektbesprechung mit dem Mentoring-Team erhältst Du Feedback zu Deinem Lösungsansatz.

Data Scientist Trainingsprogramm

Data Analyst Trainingsprogramm

Du möchtest dieses Modul losgelöst vom gesamten Trainingsprogramm und ohne Bildungsgutschein absolvieren? Für Selbstzahlende bieten wir flexible Zahlungs- und Finanzierungsmöglichkeiten an.  Bitte wende Dich direkt an unser Beratungsteam, um mehr Informationen zu erhalten.

Hast Du noch Fragen?

Finde mit uns Dein Trainingsprogramm und starte Deine Datenkarriere! Buche jetzt eine unverbindliche Beratung.

+6.000 Absolvent:innen

91 % Abschlussquote

AZAV-zertifiziert

FAQ

Was unterscheidet StackFuel von anderen Trainingsanbietern?

Unsere Trainings werden von unserem eigenen Team aus Data Scientists und Fachexpert:innen entwickelt und produziert, die Dich als Teilnehmende:n während der Weiterbildung im persönlichen Mentoring betreuen. Dabei setzen wir nicht nur auf realitäts- und praxisnahe Inhalte, sondern sorgen im persönlichen Austausch dafür, dass alle Deine Fragen beantwortet werden und garantieren so Deinen Lernerfolg.

Dank unserem “Learning-by-doing“-Prinzip lernst Du in unserer interaktiven Lernumgebung mit realistischen Datensätzen und echten Business Cases aus der Industrie und bereitest Dich so perfekt auf den erfolgreichen Berufseinstieg in einen Daten-Job vor.

Wieso ist StackFuel die richtige Wahl für mich?

Mit StackFuel setzt Du auf einen Marktführer mit Deutschlands innovativster Lernplattform, um Deine Daten-Skills praxisnah auszubauen. In zertifizierten Trainingsprogrammen lernst Du online, zeitlich flexibel und mit 80 % praktischen Inhalten.

So gelingt Dir der Quereinstieg als Data Analyst oder Data Scientist und Du lernst Daten und Grundlagen künstlicher Intelligenz professionell anzuwenden. Deine neue Datenkarriere beginnt mit Deiner Online-Weiterbildung bei StackFuel.

Wie können mir Datenskills zu einer neuen Karriere verhelfen?

Daten sind aus unserem (Berufs-)Leben nicht mehr wegzudenken. In fast allen Bereichen helfen Daten Dir dabei, Sachverhalte besser zu verstehen und Entscheidungen präziser treffen zu können. Daten-Skills sind der Schlüssel, um Daten auch richtig verwerten und interpretieren zu können. Auch wenn Du es vielleicht nicht merkst, arbeitest, interagierst und generierst Du jeden Tag Daten.

Diese Daten werden für Unternehmen immer wichtiger und sind die Basis für Entscheidungen und Geschäftsmodelle, was Datenprofis für Unternehmen unglaublich sehr macht.

Data Science.

1
Preparation

Kapitel 1: Data Analytics with Python

Kapitel 2: Lineare Algebra

Kapitel 3: Probability Distributions

2
Machine Learning Basics

Kapitel 1: Supervised Learning (Regression)

Kapitel 2: Supervised Learning (Classification)

Kapitel 3: Unsupervised Learning (Clustering)

Kapitel 4: Unsupervised Learning (Dimensionality Reduction)

Kapitel 5: Outlier Detection

3
Supervised Learning

Kapitel 1: Data Gathering

Kapitel 2: Logistic Regression

Kapitel 3: Decision Trees and Random Forests

Kapitel 4: Support Vector Machines

Kapitel 5: Neural Networks

4
Advanced Topics

Kapitel 1: Visualization and Model Interpretation

Kapitel 2: Spark

Kapitel 3: Übungsprojekt

Kapitel 4: Abschlussprojekt

Hast Du noch Fragen?

FAQ

Profit Förderprogramm

Gefördert von

Mitglied bei

Auf deutschen Servern von:

Data Science.

1Preparation

Kapitel 1: Data Analytics with Python

Kapitel 2: Lineare Algebra

Kapitel 3: Probability Distributions

2Machine Learning Basics

Kapitel 1: Supervised Learning (Regression)

Kapitel 2: Supervised Learning (Classification)

Kapitel 3: Unsupervised Learning (Clustering)

Kapitel 4: Unsupervised Learning (Dimensionality Reduction)

Kapitel 5: Outlier Detection

3Supervised Learning

Kapitel 1: Data Gathering

Kapitel 2: Logistic Regression

Kapitel 3: Decision Trees and Random Forests

Kapitel 4: Support Vector Machines

Kapitel 5: Neural Networks

4Advanced Topics

Kapitel 1: Visualization and Model Interpretation

Kapitel 2: Spark

Kapitel 3: Übungsprojekt

Kapitel 4: Abschlussprojekt

Hast Du noch Fragen?

FAQ

Profit Förderprogramm

Gefördert von

Mitglied bei

Auf deutschen Servern von:

1
Preparation

2
Machine Learning Basics

3
Supervised Learning

4
Advanced Topics