Die zertifizierte Online-Weiterbildung zum Data Scientist – Fokus Python befähigt Dich dazu, Prognosemodelle aus Daten abzuleiten, zu verifizieren und zu interpretieren, um die Modellergebnisse effizient zu kommunizieren.
Der zusätzliche Aufbau von Fähigkeiten im Bereich des Machine Learnings qualifiziert Dich mit erfolgreichem Abschluss des Karrierepfades für die Jobrolle als Data Scientist oder eine andere analytische Jobrolle wie dem wie dem Business Intelligence Analyst oder Financial Analyst.
Ziel:
Auffrischung der Kenntnisse im Umgang mit Python sowie mathematischer Grundlagen Beschreibung
Beschreibung:
Teilnehmende führen Analysen und Datenmanipulationen in Python aus und nutzen dabei die Pakete Pandas und Matplotlib.
Kapitel 1 – Data Analytics with Python:
Teilnehmende machen sich mit unserer interaktiven Programmierumgebung – dem Data Lab – vertraut und frischen die wichtigsten Programmier- und Python-Grundlagen zur Datenverarbeitung mit Pandas, Datenvisualisierung mit Matplotlib und Seaborn und Datenbankabfrage mit SQL Alchemy auf.
Kapitel 2 – Linear Algebra:
Teilnehmende machen sich mit dem mathematischen Hintergrund von Data-Science-Algorithmen vertraut und lernen die Grundbegriffe der linearen Algebra kennen. Unter Verwendung des Pakets Numpy rechnen die Teilnehmenden mit Vektoren und Matrizen.
Kapitel 3 – Probability Distributions:
Teilnehmende lernen mehr über den statistischen Hintergrund von Data-Science-Algorithmen. Sie beschäftigen sich mit wichtigen statistischen Konzepten und lernen diskrete und kontinuierliche Verteilungen kennen. Darüber hinaus erhalten Teilnehmende einen Einblick in die Versionierung von Code mit Git.
Ziel:
Lösen von überwachten und unüberwachten Machine-Learning-Problemen mit sklearn
Beschreibung:
Teilnehmende erstellen Data-Science-Workflows mit sklearn, evaluieren ihre Modell-Performance anhand von geeigneten Metriken und werden für das Problem des Overfittings sensibilisiert.
Kapitel 1 – Supervised Learning (Regression):
Anhand der linearen Regression erlernen Teilnehmende den Umgang mit dem Python-Paket sklearn. Weiterhin beschäftigen sie sich mit den Annahmen des Regressionsmodells und der Evaluation der erzeugten Prognosen. In diesem Zuge werden auch der Bias-Variance Trade-Off, Konzepte der Regularisierung sowie verschiedene Maße der Modellgüte verdeutlicht.
Kapitel 2 – Supervised Learning (Classification):
Teilnehmende werden in Klassifizierungsalgorithmen anhand des k-Nearest-Neighbors-Algorithmus eingeführt und lernen, den Algorithmus zu evaluieren und die Klassifizierungsperformance einzuschätzen. Sie optimieren die Parameter ihres Modells unter Beachtung der Aufteilung der Daten in Trainings- und Evaluationssets.
Kapitel 3 – Unsupervised Learning (Clustering):
Teilnehmende lernen den k-Means-Algorithmus als Beispiel eines Algorithmus des unüberwachten Lernens kennen. Die Annahmen und Performance-Metriken des Algorithmus werden kritisch beleuchtet und ein kurzer Ausblick auf eine Alternative zum k-Means-Clustering geworfen.
Kapitel 4 – Unsupervised Learning (Dimensionality Reduction):
Teilnehmende lernen, wie sie mithilfe einer Principal Component Analysis (PCA) die Dimension der Daten verringern können und nutzen die PCA, um unkorrelierte Features aus den Ursprungsdaten zu erzeugen. In diesem Zusammenhang wird das Thema Feature Engineering näher betrachtet und aus den alten Features neue erzeugt.
Kapitel 5 – Outlier Detection:
Teilnehmende lernen verschiedene Ansätze kennen, um Ausreißer zu identifizieren und verstehen, mit diesen ungewöhnlichen Datenpunkten umzugehen. Sie nutzen robuste Maße und Modelle, um den Einfluss der Ausreißer zu minimieren.
Ziel:
Erweiterung des eigenen Data-Science-Toolkits
Beschreibung:
Teilnehmende intensivieren ihre Kenntnisse über Modelle zur Klassifikation von Daten. Dabei erweitern sie ihre Fähigkeiten im Sammeln und Aufbereiten von Daten.
Kapitel 1 – Data Gathering:
Teilnehmende lernen, Daten zu sammeln, indem sie Webseiten und PDFDokumente auslesen. Mithilfe von Regular Expressions strukturieren sie gesammelte Textdaten so, dass sie diese zusammen mit bekannten Algorithmen verwenden können.
Kapitel 2 – Logistic Regression:
Teilnehmende lernen einen zweiten Klassifizierungsalgorithmus kennen: die logistische Regression. Sie nutzen neue Performance-Metriken zur Evaluation der Ergebnisse und erfahren, wie sie nicht-numerische Daten für ihre Modelle nutzbar machen.
Kapitel 3 – Decision Trees and Random Forests:
Teilnehmende lernen den Entscheidungsbaum als leicht zu interpretierendes Modell kennen. Sie kombinieren mehrere Modelle zu einem Ensemble, um die Vorhersagen ihres Modells zu verbessern. Weiterhin erhalten sie Methoden zu unausgeglichenen Kategorien an die Hand.
Kapitel 4 – Support Vector Machines:
Teilnehmende lernen einen letzten Klassifizierungsalgorithmus kennen – Support Vector Machines (SVM) und beleuchten das Verhalten verschiedener Kernel für die SVM. Außerdem erlernen sie die typischen Schritte des Natural Language Processing (NLP) und bearbeiten ein NLPSzenario unter Verwendung von Bag-of-Words-Modellen.
Kapitel 5 – Neural Networks:
Teilnehmende werden in künstliche neuronale Netze eingeführt und lernen mehr über Deep Learning, um ein künstliches neuronales Netzwerk mit mehreren Schichten zu erzeugen und auf ein Datenset anzuwenden.
Ziel:
Selbstständiges Anwenden einfacher und komplexer Modellierungen
Beschreibung:
Teilnehmende erlangen Souveränität im Lösen von Data-Science-Problemen und lernen, Ergebnisse kompetent zu kommunizieren.
Kapitel 1 – Visualization and Model Interpretation:
Teilnehmende erlernen wichtige Methoden zur Interpretation und Visualisierung von Machine-Learning-Modellen. Durch die Verwendung modelagnostischer Methoden zur Interpretation lernen sie Erkenntnisse zur Funktionsweise ihrer Modelle abzuleiten und zu kommunizieren.
Kapitel 2 – Spark:
Teilnehmende erfahren, weshalb die Arbeit mit verteilten Speichersystemen relevant ist. Mit dem Python-Paket PySpark erlernen sie verteilte Datenbanken auszulesen, Big-Data-Analysen durchzuführen und bekannte Machine-Learning-Algorithmen auf verteilten Systemen zu nutzen.
Kapitel 3 – Exercise Project:
Teilnehmende bearbeiten ein Prädiktionsproblem mit Hilfe eines größeren Datensets und setzen ihre Data-Science-Fähigkeiten von der Reinigung des Datensets bis zur Interpretation des Modells eigenständig ein. In einer Projektbesprechung mit dem Mentorenteam von StackFuel erhalten Teilnehmende Feedback zu ihrem Lösungsansatz.
Kapitel 4 – Final Project:
Teilnehmende erhalten ein weiteres größeres Datenset, das sie selbstständig analysieren und im Vergleich zum Übungsprojekt mit weniger Hilfestellungen lösen müssen. In einer individuellen Projektbesprechung mit dem Mentoring Team von StackFuel erhalten Teilnehmende Feedback zu ihrem Lösungsansatz.
Der Bedarf an Data Expert:innen ist hoch. Bis 2025 werden rund 4 Millionen Datenexpert:innen in Europa benötigt. Allein in Deutschland sind derzeit 149.000 IT-Jobs unbesetzt. Vor allem die Nachfrage nach Daten- und KI-Experten nimmt weiterhin enorm zu.
Aber eine Entscheidung für eine Daten-Karriere ist noch so viel mehr als nur eine sichere Zukunftsentscheidung! Als Datenexpert:in beschäftigst Du Dich mit starken, gesellschaftlich relevanten Themen, bist gleichzeitig Tech-Profi und kommunikativ und kreativ. Der Beruf ist abwechslungsreich, lässt sich mit den meisten anderen Berufen kombinieren und bietet ein attraktives Gehalt. Und das Wichtigste: Er ist mit uns zielsicher erlernbar!
Ja, nach erfolgreichem Abschluss der Weiterbildung erhältst Du ein Abschlusszertifikat von uns, dass Du bei Deinen Bewerbungen vorzeigen kannst. Data Analysts und Data Scientists werden in vielen Wirtschaftsbereichen händeringend gesucht. Selbst ohne einschlägige Berufserfahrungen stehen Deine Chancen auf einen Einstiegsjob also gut. Dazu kommt, dass es in fast jeder Branche Analysten gibt, diese haben dann zwar unterschiedliche Jobtitel, aber die Fähigkeiten, die Du dazu brauchst, sind dieselben, wie die des Data Analyst oder Data Scientist.
Nein, die Weiterbildung ist zeitlich flexibel und berufsbegleitend gestaltet. Du kannst uneingeschränkt Deinem Beruf nachgehen und kannst Dir Deine Lernzeiten so legen, wie sie für Dich zeitlich am besten passen. Solltest Du plötzlich doch mehr Zeit zur Verfügung haben, kannst Du Dich gerne bei uns per E-Mail melden und wir schalten in Deinem Konto die Lerninhalte für die Teilzeit-Variante frei. In dieser Variante kannst Du die Weiterbildung innerhalb von nur vier Wochen absolvieren. Solltest Du merken, dass Du doch mehr Zeit brauchst, kannst Du die Inhalte dennoch in der Regelzeit absolvieren.
Ja, unsere Online-Weiterbildungen sollen Dir die größtmögliche Flexibilität bieten. Grundsätzlich empfehlen wir sechs bis acht Stunden pro Woche zum Lernen einzuplanen. Wann Du diese Zeit einplanen willst, liegt bei Dir und wird von uns nicht vorgeschrieben. In unseren Karrierepfaden, dem Data Analyst und Data Scientist Kurs, bieten wir Dir Live-Webinare, in denen Du unseren Mentor:innen Fragen stellen kannst, an denen Du aber nicht teilnehmen musst, wenn es nicht in Deinen Zeitplan passt.
(Ausgenommen sind Teilnehmende unserer geförderten Weiterbildungen. Diese müssen eine feste Stundenzahl pro Woche wahrnehmen und sind verpflichtet an den Live-Webinaren teilzunehmen.)
StackFuel GmbH
Nostitzstraße 20
10961 Berlin
info@stackfuel.com
030 / 544 533 420
AGB • Impressum • Datenschutz
Wir benötigen Ihre Zustimmung, bevor Sie unsere Website weiter besuchen können. Wir verwenden Cookies und andere Technologien auf unserer Website. Einige von ihnen sind unerlässlich, während andere uns helfen, diese Website und Ihre Erfahrung zu verbessern. Weitere Informationen über die Verwendung Ihrer Daten finden Sie in unserer Datenschutzerklärung.
Wir verwenden Cookies und andere Technologien auf unserer Website. Einige von ihnen sind unerlässlich, während andere uns helfen, diese Website und Ihre Erfahrung zu verbessern. Weitere Informationen über die Verwendung Ihrer Daten finden Sie in unserer Datenschutzerklärung. Hier finden Sie eine Übersicht über alle verwendeten Cookies. Sie können Ihre Zustimmung für ganze Kategorien geben oder sich weitere Informationen anzeigen lassen und bestimmte Cookies auswählen.