Die wichtigsten Fragen zu Gehalt, Aufgaben, Voraussetzungen und zum Data Scientist Quereinstieg
Der sexieste Job des Jahrzehnts ist nicht so neu wie viele glauben. Der Beruf des Data Scientist stößt regelmäßig auf die unterschiedlichsten Reaktionen, dabei existiert er schon seit den 1960er Jahren. Und er hat viel zu bieten: Ein hohes Gehalt, einen krisensicheren Arbeitsplatz und viele offene Stellen durch den akuten Fachkräftemangel. Data Scientist werden ist also sehr attraktiv, auch mit Quereinstieg ohne technische Vorkenntnisse. Und das Beste: Dank Bildungsgutschein kannst Du Deine Weiterbildung unter bestimmten Voraussetzungen sogar kostenlos bekommen.
Aber was ist ein Data Scientist eigentlich? In seinem Arbeitsalltag analysiert ein Data Scientist große Datenmengen, sucht nach Beziehungen zwischen den Daten und nutzt diese als Grundlage, um Vorhersagen für Entwicklungen und Trends abzuleiten. Viele Unternehmen sammeln bereits Daten, aber diese haben nur einen Wert, wenn sie auch nutzbringend ausgewertet werden können. Aus dieser Datenmenge und Big Data wird so eine Entscheidungshilfe, auch „Smart Data“ genannt.
Damit das gelingt, nutzt ein Data Scientist fortschrittliche Analysemethoden, um mit höchstmöglicher Verlässlichkeit Trends vorherzusagen. Diese Methode wird auch Predictive Analytics genannt und hilft dabei, einem Unternehmen zur bestmöglichen Entscheidung zu kommen, um so einen Wettbewerbsvorteil gegenüber der Konkurrenz zu haben.
Data Scientists sind gefragt
Datenexperten wie der Data Scientist sind auf dem Arbeitsmarkt aktuell so gefragt wie nie. Neben ihrer Kernkompetenz im Umgang mit Daten müssen sie in der Regel auch andere technische Fähigkeiten wie die Python-Programmierung besitzen, um sie für viele Unternehmen wertvoll zu machen. Dass sich die Nachfrage weiter verstärken wird, wissen viele Unternehmen bereits und steuern mit der Aus- und Weiterbildung ihrer Belegschaft entgegen.
Deshalb interessieren sich auch immer mehr Arbeitnehmende sich für diesen zukunftssicheren und angesehenen Job. Bevor Du anstrebst, Data Scientist zu werden, solltest Du allerdings wissen, welche Fähigkeiten ein Data Scientist besitzen sollte, wie Du den Data Science Quereinstieg schaffen kannst und welche Rolle Mathematik, Programmieren und Statistik für den Beruf spielen. Diesen Fragen und mehr wollen wir in diesem Artikel nachgehen, um Dir ein Deinen Einstieg zu erleichtern.
Was ist ein Data Scientist?
Unsere Welt ist digital und von Tag zu Tag besser vernetzt. Durch den Fortschritt der Digitalisierung steigt auch die Menge an Daten und Wichtigkeit sie aktiv zu nutzen. Dementsprechend wächst auch der Bedarf an Datenexperten wie dem Data Scientist, die mit dieser Datenflut umgehen und sie in wertvolle Analysen bzw. Berichte verwandeln können.
Übersetzt man Data Scientist aus dem Englischen, bedeutet die Berufsbezeichnung so viel wie Datenwissenschaftler. Einfach erklärt sind Data Scientists analytisch denkende Datenexperten, die unternehmenseigene Datenquellen sowie Fremddaten dazu nutzen, um Vorhersagen zu treffen und damit wirtschaftliche Herausforderungen und Chancen für das Unternehmen frühzeitig zu erkennen.
Statt sich zu fragen, was passiert ist, fragst Du als Data Scientist danach, was passieren wird. Natürlich ist ein Data Scientist kein Hellseher oder folgt nur seinem Bauchgefühl. Du stützt Deine Annahmen auf reale Daten, die Du mit System auswertest und Wissen aus ihnen gewinnst. Zuerst wird dafür eine Hypothese aufgestellt, die Du überprüfen möchtest. Dafür benötigst Du ein gutes Verständnis der betriebswirtschaftlichen Zusammenhänge.
Als Data Scientist identifizierst Du geeignete Datenquellen und sammelst die relevanten Daten und erstellst ein Modell, das Du laufend anpasst, solange bis Hypothese und Realität so nah wie möglich beieinander liegen. Oft musst Du als Data Scientist nach kreativen Lösungen suchen, wie Du die Datenqualität verbessern kannst, um Analysen durchzuführen, die sonst nicht möglich wären. Die Erkenntnisse aus der Arbeit eines Data Scientists soll Unternehmensführungen dabei unterstützen, die richtigen Geschäftsentscheidungen zu fällen und strategisch bei der Umsetzung vorzugehen.
Dabei verlässt Du Dich nicht nur auf die Daten, die dem Unternehmen vorliegen, sondern greifst auch auf Quellen wie Social Media zurück. Als Data Scientist nutzt Du dazu wissenschaftliche Ansätze und Methoden aus der Informatik, der Mathematik und der Statistik, um große Datenmengen, die teilweise unstrukturiert sind, systematisch auszuwerten.
Wie das im Arbeitsalltag praktisch aussieht, hängt stark davon ab, in welchem Bereich ein Data Scientist arbeitet, der Wirtschaft oder Wissenschaft, und kann von Branche zu Branche und Unternehmen zu Unternehmen variieren. Ein Data Scientist kann sich mit dem Kaufverhalten von Kunden, selbstfahrenden Autos oder Automatisierungen im Finanzbereich beschäftigen und jedes Projekt bringt seine eigenenHerausforderungen mit.
Als Data Scientist trägst Du eine große Verantwortung, denn von den Ergebnissen Deiner Analysen hängt für Unternehmen und Kunden viel ab. Analysen im Medizinbereich oder das Trainieren einer künstlichen Intelligenz für selbstfahrende Autos haben große Auswirkungen auf Einzelpersonen und die Gesellschaft. Das macht den Beruf des Data Scientists so vielseitig und erfüllend.
Was ist der Unterschied zum Data Analyst?
Im Gegensatz zum Data Analyst, der eher für eine klassische Datenanalyse verantwortlich ist, hat der Data Scientist einen stärkeren wissenschaftlichen Fokus. Zwar lassen sich beide Berufsbilder nicht trenngenau voneinander abgrenzen, weil sich viele ihrer Tätigkeiten überschneiden, aber pauschal kann davon ausgegangen werden, dass die Aufgabenbereiche des Data Scientist fortgeschrittenere, wissenschaftliche Analyse- und Vorhersagemethoden erfordern.
Aus diesem Grund besitzen Data Scientists in der Regel einen akademischen Hintergrund und kommen aus Fachgebieten wie der Mathematik, Physik oder Informatik. Von dort bringen sie wichtige Fähigkeiten für den Beruf des Data Scientists mit wie z. B. Statistik, Analyseverfahren oder Wahrscheinlichkeitsrechnung, die für Anwendungen von Machine Learning und künstlicher Intelligenz zwingend erforderlich sind.
Eine solide Kenntnis der Mathematik und Statistik sind die Grundpfeiler der Arbeit des Data Scientists. Besonders wichtig ist, dass er nicht nur im kleinen Kämmerlein Daten analysiert, sondern sie auch anderen verbal vermitteln kann. Eine gute Kommunikationsfähigkeit zeichnet den Data Scientist aus und macht ihm zum wertvollen Berater der Unternehmensführung.
Deine Aufgaben als Data Scientist
Nachdem wir geklärt haben, was ein Data Scientist ist und warum der Beruf so gefragt ist, kommen wir nachfolgend dazu, was Data Scientists genau machen, was Deine Rolle im Unternehmen ist und welche Aufgabenbereiche Du als Data Scientist verantwortest.
1 Fragestellung formulieren
Bevor Du mit Deiner Analyse beginnen kannst, musst Du definieren, was Du herausfinden möchtest. Das Resultat Deiner Analyse ist nämlich nur so gut, wie die Fragestellung, die der Analyse zugrunde liegt. Das macht diesen Schritt zum wichtigsten im gesamten Analyseprozess. Auch ein Haus ist nur so stabil wie das Fundament, auf dem es gebaut wurde. Damit Du die richtige Fragestellung festlegen kannst, musst Du also das Ziel der Analyse bestimmen.
Dabei wirst Du Dich manchmal wie Sherlock Holmes fühlen, denn nicht selten ist das offensichtliche Problem nicht das, das auch zum Kern der Lösung führt. Du wirst also das Problem, das Du lösen willst, zuerst aus verschiedenen Perspektiven betrachten müssen, um Dir ein Gesamtbild zu verschaffen. Möglicherweise wirst Du Dich mit ausreichend Erfahrung sogar eigenständig auf die Suche nach Optimierungsmöglichkeiten im Unternehmen machen und spannende Use Cases identifizieren.
2 Daten sammeln und bereinigen
Nun folgt der Schritt, in dem Du die passenden Daten zur Beantwortung Deiner Fragestellung zusammenträgst. Dafür identifizierst Du zuerst die richtigen Datenquellen:
- First-Party-Daten, die direkt von Dir oder Deinem Unternehmen erhoben werden
- Second-Party-Daten, die von einem anderen Unternehmen kommen
- Third-Party-Daten, die aus externen Quellen wie Social Media stammen
Um Second- und Third-Party-Daten zu sammeln, musst Du Dir eine gute Strategie überlegen und Daten aus Umfragen, Beobachtungen aus Social-Media-Beiträgen oder ein Online-Tracking einer Webseite nutzen. In einigen Fällen kann es sogar notwendig sein, eigene Modelle und Algorithmen für das Data Mining zu entwickeln. Sobald Du ausreichend Daten gesammelt hast, müssen diese bereinigt werden, denn diese werden sowohl in strukturierter als auch unstrukturierter Form vorliegen. Durch die Bereinigung und Validierung der Daten kannst Du ihre Genauigkeit, Vollständigkeit und Einheitlichkeit sicherstellen.
3 Daten analysieren
Eine besondere Fähigkeit von Data Scientists ist die explorative Analyse. Bei der explorativen Datenanalyse stellst Du Deine anfänglichen Annahmen, Hypothesen oder Datenmodelle zurück und versuchst stattdessen die zugrunde liegende Struktur der Daten sichtbar zu machen. Dadurch kannst Du dann wichtige Variablen erkennen und Ausreißer und Anomalien ausfindig machen. In der anschließenden Phase der Datenverarbeitung werden die Daten in ein System eingegeben. Das kann ein CRM wie Salesforce sein oder ein Data Warehouse.
4 Daten modellieren
In der Datenmodellierung wird dargestellt, wie Daten durch eine Softwareanwendung oder die unternehmenseigene Datenarchitektur fließen. Du kannst es Dir wie eine Blaupause vorstellen, die zeigt, wie Daten gesammelt und gespeichert werden. Wenn Du Daten modellierst, handelst Du wie ein Bauingenieur, der unerwartete Hürden zu überwinden und Teilstücke zu reparieren versucht, bis alles zusammenpasst. Du findest dabei die effizienteste Methode, um Informationen zu speichern und gleichzeitig einen vollständigen Zugriff und ein umfassendes Reporting zu ermöglichen.
5 Dokumentation, Visualisierung und Präsentation
Von einem Data Scientist wird erwartet, dass Du Deine Prozesse dokumentierst und ausreichend beschreibende Informationen bereitstellst, die Dir für die eigene Arbeit, aber auch Kollegen und andere Datenwissenschaftlern in der Zukunft helfen. Nicht jeder kann Statistiken lesen und verstehen. Die Visualisierung ist deshalb einer der wichtigsten Fähigkeiten, damit die gesammelten Erkenntnisse von wichtigen Unternehmensfunktionen verstanden werden und diese nach ihnen handeln können.
Data Scientist werden: Diese Fähigkeiten brauchst Du
Inzwischen fragst Du Dich wahrscheinlich: „Wie werde ich Data Scientist?“ Data Scientists benötigen als Grundlage ein breites Spektrum an Fähigkeiten, das von technischen Kenntnissen in Programmiersprachen und statistischer Software bis hin zu Kommunikation und Storytelling reichen. Zweifellos hängen die exakten Anforderungen an die Fähigkeiten eines Data Scientist von Auftraggeber, Aufgabenfeld und Karrierestufe ab. Um einen Data Scientist Quereinstieg zu schaffen und Unternehmen zu helfen, intelligentere Entscheidungen zu treffen und bessere Produkte zu entwickeln, benötigen Data Scientists zwei Arten von Skill-Sets:
Technische Fähigkeiten
Als Data Scientist solltest Du ein solides Verständnis von Mathematik und Statistik besitzen, da Du für die Analyse von Daten sehr oft statistische Modelle benötigst. Zusätzlich zum Wissen, wie man Daten sammelt, bereinigt und manipuliert, müssen Data Scientists mit statistischer Modellierungssoftware, wie SQL-Datenbanken und der Hadoop-Plattform, umgehen können.
Außerdem sind Programmierfähigkeiten von großem Vorteil, denn so kannst Du eigenständig Modellierungsfunktionen erweitern und bist unabhängig von starren Softwarelösungen. Darüber hinaus gelten Python und R als die Must-Have-Programmiersprachen im Bereich Data Science.
Programmieren: Python, SQL, Scala, Java, R, MATLAB
Ein Data Scientist muss einerseits Programmiersprachen verstehen, aber auch Datenbanken verwalten können. Das Programmieren ist Dein Mittel, um Daten zu verarbeiten und zu analysieren.
Machine Learning: Natural Language Processing, Klassifizierung, Clustering, Deep Learning
Ein Data Scientist nutzt die intelligenten Verfahren des Machine Learnings, um Entscheidungsfindungen, die bislang von Menschen gemacht wurden, durch Computer zu automatisieren. Ein Computer weiß anfänglich nicht, welche Entscheidung die richtige ist, deshalb muss ein Data Scientist diesen Computer laufend trainieren, bis die Vorhersagen des Computers präzise genug sind.
Data Visualisierung: Tableau, SAS, D3.js, Python, Java, R
Ein Data Scientist muss seine gewonnenen Erkenntnisse auch in Bilder umsetzen, um sie zu präsentieren und anderen, ohne seine Fachkenntnisse zu vermitteln.
Big Data: MongoDB, Oracle, Microsoft Azure, Cloudera
Ein Data Scientist nutzt sowohl strukturierte als auch unstrukturierte Daten. Nicht selten kommen bei der Datenanalyse dann auch Big-Data-Techniken zum Einsatz.
Soft Skills
Ein Data Scientist muss mehr können als einfach nur die richtigen Tools zu steuern, er nutzt sie, um Daten auf verschiedene Arten zu analysieren. Dafür nutzt er seine Kenntnisse der Statistik, Wahrscheinlichkeitsrechnung oder A/B-Tests. Das erfordert nicht nur sehr viel Kreativität, sondern auch Lösungsorientiertheit. Oft müssen Data Scientists neue Datenbanken entwerfen oder neue Algorithmen entwickeln. Nicht zuletzt muss ein Data Scientist sehr gut kommunizieren können, nicht nur mit dem eigenen Team, sondern auch dem Management oder Kunden. Der Job erfordert also nicht nur Hard Skills, sondern auch ganz eigene Soft Skills.
Kommunikation: Effektive Kommunikation ist die wichtigste nicht-technische Fähigkeit, die Du als Data Scientist brauchst. Als Geschichtenerzähler weißt Du, wie Du Daten visualisieren und ihre Ergebnisse an wichtige Stakeholder kommunizieren kannst, die möglicherweise keinen technischen Hintergrund besitzen.
Kritisches Denken: Kritisches Denken ist eine sehr wertvolle Fähigkeit in jedem Beruf, ganz besonders aber für die Datenwissenschaft. Sie hilft Dir als Data Scientist dabei, Erkenntnisse zu finden, Fragen zutreffend zu formulieren und nachvollziehen zu können, wie das Ergebnis der Datenanalyse einem Unternehmen nützt und welche nächsten Maßnahmen angestoßen werden müssen.
Analytische Fähigkeiten: Diese Fähigkeit hilft Data Scientist auf der Suche nach Antworten und dabei erste Annahmen zu hinterfragen. Data Scientist fragen immer zu nach dem „Warum“ und folgen ihrem Drang, neue Fragen aufzudecken, besonders die, die vorher nie gestellt wurden. Als Data Scientist wirst Du Deine Spürnase anwerfen, um zugrundeliegende Wahrheiten zu entlarven und Dich auf die Jagd nach Antworten zu begeben.
Problemlösungsfähigkeit: In Deinem Arbeitsalltag als Data Scienstist musst Du Möglichkeiten erkennen und Lösungen für allerhand Probleme finden, indem Du bestehende Annahmen hinterfragst, Ressourcen identifizierst und Deinen Detektivhut aufsetzt, um den schnellsten Weg zur Lösung zu finden. Die Fähigkeit und der Wunsch, Probleme zu lösen, ist der Kern der Datenwissenschaft.
Lebenslanges Lernen: Datenwissenschaftler verstehen sich selbst als „work in progress“. Sie verstehen, dass niemand alles wissen kann und da sich die Datenwissenschaft stets in rasantem Tempo weiterentwickelt, müssen auch erfahrene Data Scientists immer Entwicklungen verfolgen, um am Zahn der Zeit zu bleiben. Ein neues Problem, kann häufig auch eine neue Forschung nach sich ziehen. Diese natürliche Neugier treibt Dich als Data Scientist an.
Wie werde ich Data Scientist? Voraussetzungen für den Data Science Quereinstieg
Ob Du es glaubst oder nicht, auch Quereinsteiger können Data Scientists mit der richtigen Ausbildung werden. Data Scientists sind in der Regel höher qualifiziert als Data Analysts. Laut KDnuggets haben 88 Prozent der Data Scientists mindestens einen Master-Abschluss und 46 Prozent haben einen Doktortitel.
Es mag so klingen als wäre eine naturwissenschaftliche Laufbahn eine Grundvoraussetzung für eine Karriere als Data Scientist. Das ist zwar sehr hilfreich, aber nicht zwingend erforderlich für diesen Karriereweg. Denn auch, wenn MINT-Studienfächer wichtige Voraussetzungen liefern, so gibt es durchaus auch Quereinsteiger im Bereich der Datenanalyse und -wissenschaft.
Tatsächlich kann es von Vorteil sein, bereits Erfahrungen in anderen Fachabteilungen gesammelt zu haben, um diese wiederum erfolgreich zu unterstützen. Jemand der die Prozesse, Abläufe und Arbeitsweisen von Abteilungen kennt, erkennt auch versteckte Potenziale zur Optimierung, Datensammlung und Lösungsfindung. Ein Data Scientist muss eine Abteilung fachlich verstehen, um sie gut beraten zu können. Die wohl wichtigste Voraussetzung für einen Data Scientist Quereinstieg ist deshalb wohl Deine Neugier und Lernbereitschaft.
Wie sieht ein typischer Tag für Data Scientists aus?
Auch hier gibt es nicht den einen typischen Tag eines Data Scientists. Um den Alltag trotzdem zu veranschaulichen, wählen wir das Beispiel eines Data Scientists im Bereich personalisierte Werbung. Nennen wir ihn Paul.
Sein Tag startet mit der Überprüfung, ob neue Daten im Data Warehouse vorliegen, die er für ein Projekt benötigt. Die Daten sind personenbezogen, weshalb Paul sie erst anonymisieren lassen muss. Bevor Paul fortfahren kann, muss er zuerst prüfen, ob alle Daten vollständig sind und ob die Kodierung der Textvariablen stimmt. Er findet einen Fehler in den Daten der letzten zwei Wochen und macht einen Data Engineer im Team auf diesen Bug, einen technischen Fehler, aufmerksam. Die Daten, die Paul schon hat, pflegt er in ein Modell ein und probiert verschiedene Herangehensweisen zur Analyse aus.
Am Nachmittag wird Paul kreativ und testet, welche Performance er aus den Daten herausholen kann. Er bespricht seine Ideen mit seinen Kollegen und googelt mögliche Herangehensweisen und zieht Fachliteratur zu Rate. In den folgenden Tagen wird der Data Engineer mit den fehlenden Daten zu Paul kommen, die er dann zusammen mit den vorhandenen Daten in ein größeres Modell überträgt, wo sie dann auf die personalisierte Werbung angewendet werden. Paul wird dann die Ergebnisse seiner Analysen und Handlungsempfehlungen visuell aufbereiten und anderen Abteilungen präsentieren.
Was verdient ein Data Scientist und welche Karrieremöglichkeiten gibt es?
Da der Job gerade sehr gefragt ist, können die Vergütungen recht hoch ausfallen. Als Berufseinsteiger startest Du laut der Fachseite Get in IT mit einem durchschnittlichen Jahresbruttogehalt von 45.000 Euro. Was am Ende Deiner Datenkarriere auf Dein Konto überwiesen wird, ist wie in jeder Karriere von verschiedenen Faktoren wie Branche, die Größe Deines Arbeitgebers und Deine Position im Unternehmen abhängig. Es gibt natürlich keine starren Gehaltsgrenzen, aber üblicherweise liegt das Höchstgehalt zwischen 99.800 und 108.200 Euro Jahresbrutto, je nach Berufserfahrung und Personalverantwortung.
Als Data Scientist kannst Du überall dort arbeiten, wo große Datenmengen gesammelt werden und ein Interesse besteht, aus diesen Daten zu lernen und Prozesse zu optimieren:
- Logistik – Hier müssen Routen und Fahrpläne optimiert werden, um die schnellsten Routen zu finden.
- Online-Handel – Dort muss herausgefunden werden, wie Retouren verringert werden, indem Kunden direkt das passende Produkt vorgeschlagen bekommen.
- Energieversorgung – Wenn Verbrauchsspitzen und -engpässe vorhergesagt werden können, kann die Versorgung darauf angepasst werden.
Es gibt unzählige Spezialisierungen für Data Scientists. Das ist besonders interessant für Quereinsteiger, die in einem Fachbereich schon Vorkenntnisse in diesen Beruf einbringen. Dieses Vorwissen ist sehr wertvoll, denn es hilft dabei die richtigen Fragestellungen für Analysen zu identifizieren und die richtigen Schlüsse zu ziehen.
Data Scientist Quereinstieg: So geht’s
Eine kürzlich veröffentlichte Studie von McKinsey konnte zeigen, dass mehr als 100 Millionen Arbeitnehmende bis 2030 eine neue Beschäftigung suchen müssen. Viele Jobs werden nach und nach aufgrund der digitalen Transformation verschwinden, aber glücklicherweise werden auch viele neue Arbeitsplätze entstehen.
LinkedIn geht davon aus, dass in den nächsten fünf Jahren 150 Millionen Jobs im IT-Bereich oder in IT-nahen Bereichen entstehen werden. Diese Jobs sind vor allem für den nachhaltigen und langfristigen Erfolg von Unternehmen wichtig und sollten deshalb im Fokus von Jobwechslern stehen.
Die Nachfrage an Data Scientist ist schon heute sehr hoch. Angehende Data Scientists und Bewerber:innen mit Quereinstieg bekommen einen Fuß in die Tür, indem sie als Data Analysts anfangen und sich von dort aus weiterbilden und Erfahrung sammeln. Wer Du Dir nicht sicher bist, ob das Berufsbild des Data Scientist zu Dir passt, sollte einen Einsteigerkurs in Data Awareness oder Data Driven Management wählen und Dich schrittweise spezialisieren.
Informiere Dich über eine Weiterbildung zum Data Scientist und Deine Möglichkeiten einen Bildungsgutschein zu beantragen.
Fandest Du diesen Artikel interessant? Dann könnte Dich der Artikel über den Job als Data Analyst ebenfalls interessieren: Zum Artikel
Quellen:
LinkedIn (2021): „LinkedIn Jobs on the Rise: 15 opportunities that are in demand and hiring now“ [11.03.2021]
McKinsey Global Institute (2021): „The future of work after COVID-19“ [11.03.2021]
Master’s in Data Science (2020): „What is a Data Scientist“ [11.03.2021]
Get in IT: „Was macht ein Data Scientist?“ [09.06.2021]