Lerne fortgeschrittene Datenskills wie Datenmodellierung und Machine Learning.
Im zertifizierten Data Science-Modul lernst Du die Grundlagen des Machine Learnings, der Technologie, die moderner KI zugrunde liegt. Du lernst, Datenmodelle mit Python zur Vorhersage von unterschiedlichen Businessszenarien umzusetzen. Du entwickelst die Fähigkeit, überwachte und unüberwachte Machine-Learning Algorithmen zu nutzen und zu optimieren.
Durch praxisbezogene Anwendungsbeispiele erlangst Du Souveränität im Lösen von Data Science-Problemen. Das Data Science-Modul schließt Du mit einem Abschlussprojekt ab, in dem Du ein größeres Datenset zur Vorhersage von Autokäufen selbstständig analysierst und löst. Der zusätzliche Aufbau von Fähigkeiten im Bereich des Machine Learnings qualifiziert Dich mit erfolgreichem Abschluss für die Jobrolle als Data Scientist, zusätzlich zu weiteren analytischen Jobrollen wie dem Data Analyst, Business Intelligence Analyst oder Financial Analyst.
Du frischst die wichtigsten Python-Grundlagen zur Datenverarbeitung mit Pandas, Datenvisualisierung mit Matplotlib und Seaborn und Datenbankabfrage mit SQL Alchemy auf.
Du machst Dich mit dem mathematischen Hintergrund von Data-Science-Algorithmen vertraut und lernst die Grundbegriffe der linearen Algebra kennen. Unter Verwendung des Pakets Numpy rechnest Du mit Vektoren und Matrizen.
Du lernst mehr über den statistischen Hintergrund von Data-Science-Algorithmen. Du beschäftigst Dich mit wichtigen statistischen Konzepten und lernst diskrete und kontinuierliche Verteilungen kennen. Darüber hinaus erhältst Du einen Einblick in die Versionierung von Code mit Git.
Anhand der linearen Regression erlernst Du den Umgang mit dem Python-Paket sklearn. Weiterhin beschäftigst Du Dich mit den Annahmen des Regressionsmodells und der Evaluation der erzeugten Prognosen. In diesem Zuge werden auch der Bias-Variance Trade-Off, Konzepte der Regularisierung sowie verschiedene Maße der Modellgüte verdeutlicht.
Du wirst in Klassifizierungsalgorithmen anhand des k-Nearest-Neighbors-Algorithmus eingeführt und lernst, den Algorithmus zu evaluieren und die Klassifizierungsperformance einzuschätzen. Du optimierst die Parameter von Modellen unter Beachtung der Aufteilung der Daten in Trainings- und Evaluationssets.
Du lernst den k-Means-Algorithmus als Beispiel eines Algorithmus des unüberwachten Lernens kennen. Die Annahmen und Performance-Metriken des Algorithmus werden kritisch beleuchtet und ein kurzer Ausblick auf eine Alternative zum k-Means-Clustering geworfen.
Du lernst, wie Du mithilfe einer Principal Component Analysis (PCA) die Dimension der Daten verringern kannst und nutzt die PCA, um unkorrelierte Features aus den Ursprungsdaten zu erzeugen. In diesem Zusammenhang wird das Thema Feature Engineering näher betrachtet und aus den alten Features neue erzeugt.
Du lernst verschiedene Ansätze kennen, um Ausreißer zu identifizieren und verstehst, mit diesen ungewöhnlichen Datenpunkten umzugehen. Du nutzt robuste Maße und Modelle, um den Einfluss der Ausreißer zu minimieren.
Du lernst, mit Tools wie BeautifulSoup für Web Scraping und PyPDF2 für die PDF-Datenextraktion Daten zu sammeln. Mithilfe von Regular Expressions strukturierst Du gesammelte Textdaten so, dass diese zusammen mit bekannten Algorithmen verwenden können.
Du lernst einen zweiten Klassifizierungsalgorithmus kennen: die logistische Regression. Du nutzt neue Performance-Metriken zur Evaluation der Ergebnisse und erfährst, wie Du nicht-numerische Daten für Deine Modelle nutzbar machst.
Du lernst den Entscheidungsbaum als leicht zu interpretierendes Modell kennen. Du kombinierst mehrere Modelle zu einem Ensemble, um die Vorhersagen Deines Modells zu verbessern. Weiterhin erhältst Du Methoden zu unausgeglichenen Kategorien an die Hand.
Du lernst einen letzten Klassifizierungsalgorithmus kennen – Support Vector Machines (SVM) und beleuchtest das Verhalten verschiedener Kernel für die SVM. Außerdem erlernst Du die typischen Schritte des Natural Language Processing (NLP) und bearbeitest ein NLP-Szenario unter Verwendung von Bag-of-Words-Modellen.
Du wirst in künstliche neuronale Netze eingeführt und lernst mehr über Deep Learning, um ein künstliches neuronales Netzwerk mit mehreren Schichten zu erzeugen und auf ein Datenset anzuwenden.
Du erlernst wichtige Methoden zur Interpretation und Visualisierung von Machine-Learning-Modellen. Durch die Verwendung modelagnostischer Methoden zur Interpretation lernst Du, Erkenntnisse zur Funktionsweise Deiner Modelle abzuleiten und zu kommunizieren.
Du erfährst, weshalb die Arbeit mit verteilten Speichersystemen relevant ist. Mit dem Python-Paket PySpark erlernst Du verteilte Datenbanken auszulesen, Big-Data-Analysen durchzuführen und bekannte Machine-Learning-Algorithmen auf verteilten Systemen zu nutzen.
Du bearbeitest ein Prädiktionsproblem mit Hilfe eines größeren Datensets und setzt Deine Data-Science-Fähigkeiten von der Reinigung des Datensets bis zur Interpretation des Modells eigenständig ein. In einer Projektbesprechung mit dem Mentoring-Team von StackFuel erhältst Du Feedback zu Deinem Lösungsansatz.
Du erhältst ein weiteres größeres Datenset, das Du selbstständig analysieren und im Vergleich zum Übungsprojekt mit weniger Hilfestellung lösen musst. In einer individuellen Projektbesprechung mit dem Mentoring-Team erhältst Du Feedback zu Deinem Lösungsansatz.
Finde mit uns Dein Trainingsprogramm und starte Deine Datenkarriere! Buche jetzt eine unverbindliche Beratung.
Unsere Trainings werden von unserem eigenen Team aus Data Scientists und Fachexpert:innen entwickelt und produziert, die Dich als Teilnehmende:n während der Weiterbildung im persönlichen Mentoring betreuen. Dabei setzen wir nicht nur auf realitäts- und praxisnahe Inhalte, sondern sorgen im persönlichen Austausch dafür, dass alle Deine Fragen beantwortet werden und garantieren so Deinen Lernerfolg.
Dank unserem “Learning-by-doing“-Prinzip lernst Du in unserer interaktiven Lernumgebung mit realistischen Datensätzen und echten Business Cases aus der Industrie und bereitest Dich so perfekt auf den erfolgreichen Berufseinstieg in einen Daten-Job vor.
Mit StackFuel setzt Du auf einen Marktführer mit Deutschlands innovativster Lernplattform, um Deine Daten-Skills praxisnah auszubauen.In zertifizierten Trainingsprogrammen lernst Du online, zeitlich flexibel und mit 80 % praktischen Inhalten.
So gelingt Dir der Quereinstieg als Data Analyst oder Data Scientist und Du lernst Daten und Grundlagen künstlicher Intelligenz professionell anzuwenden. Deine neue Datenkarriere beginnt mit Deiner Online-Weiterbildung bei StackFuel.
Daten sind aus unserem (Berufs-)Leben nicht mehr wegzudenken. In fast allen Bereichen helfen Daten Dir dabei, Sachverhalte besser zu verstehen und Entscheidungen präziser treffen zu können. Daten-Skills sind der Schlüssel, um Daten auch richtig verwerten und interpretieren zu können. Auch wenn Du es vielleicht nicht merkst, arbeitest, interagierst und generierst Du jeden Tag Daten.
Diese Daten werden für Unternehmen immer wichtiger und sind die Basis für Entscheidungen und Geschäftsmodelle, was Datenprofis für Unternehmen unglaublich sehr macht.
StackFuel GmbH
Nostitzstraße 20
10961 Berlin
info@stackfuel.com
030 / 83790025
Lösungen
Unternehmen
Ressourcen
Kontakt