Datenanalyse: Zukunftsbranche bietet Chance zum Quereinstieg
Daten sind der Rohstoff der Zukunft. Wer sie clever auswertet, kann Prozesse optimieren, zum Beispiel in der Energiewirtschaft (Foto: NicoElNino/Fotolia).

Datenanalyse: Zukunftsbranche bietet Chance zum Quereinstieg

Noch gibt es auf dem Arbeitsmarkt zu wenige Fachkräfte, die Daten professionell auswerten können. Wer IT-Kompetenzen mitbringt, kann bei Dienstleistern eine Nische finden.

Text: Uwe Kerkow

Schätzungsweise 700 Exabyte Daten werden jeden Monat weltweit neu geschaffen. Das entspricht 700 Trillionen Byte – als Zahl geschrieben, müsste die 7 mit 20 Nullen ausgestattet werden. Verteilt auf Festplatten mit einer Kapazität von jeweils einem Terabyte, bräuchte man für diese Datenmenge über 700 Millionen Datenträger. Tendenz: weiter steigend. Und nicht nur die Menge der Daten nimmt rasant zu, auch ihre Diversität und das Tempo, mit dem sie verbreitet werden, wachsen beständig. Daher spricht man im Englischen auch von den drei großen V: „volumes" (Datenvolumen), „variety" (Datenvielfalt) und „velocity" (Frequenz der zu verarbeitenden Daten). Egal ob in der Fertigung, bei Banken und Versicherungen, in Krankenhäusern, in der Logistik oder bei Behörden: Überall fallen inzwischen große Datenmengen an.

Daten als Rohstoff der Zukunft

„Der Satz ‚Daten sind der Rohstoff des 21. Jahrhunderts' mag vielen übertrieben vorkommen", vermutet Wolfgang Lehner, Professor am Lehrstuhl Datenbanksystem der Technischen Universität Dresden. „Tatsache ist aber, dass Daten heute kein Nebenprodukt unternehmerischer Tätigkeit mehr darstellen, sondern eine Art betrieblicher Rohstoff geworden sind." Dieser Rohstoff könne – richtig genutzt – erhebliche Einsparungspotentiale freisetzen helfen und sogar die Ausweitung der Geschäftstätigkeit ermöglichen.

„Aber", gibt Lehner zu bedenken, der während seiner dreijährigen Tätigkeit als Mitglied im Vorstand des Berufsverbandes Deutscher Markt- und Sozialforscher einen guten Überblick über das Arbeitsfeld gewonnen hat, „wenn die Betriebe die in ihren Daten brach liegenden Informationen und Werte schöpfen wollen, müssen sie zunächst überhaupt erst einmal auf den Rohstoff zugreifen können." Erst danach sei an eine Weiterverarbeitung des Materials zu denken, um es schließlich erfolgreich zu analysieren und die Ergebnisse nutzbringend verwenden zu können.

Nach den möglicherweise wertvollen Erkenntnissen, die in den Rohdaten schlummern, muss also regelrecht gegraben werden – ein aufwendiger und manchmal auch kostspieliger Vorgang. Deshalb ist im Englischen auch von „Data Mining" die Rede, wenn es um Datenanalyse geht. Bedarf für den Einsatz von Datenmanagement- und -analysetools gibt es überall dort, wo große Datenmengen anfallen. Meist reichen die gängigen Methoden wie etwa Microsoft Excel oder Access jedoch schon längst nicht mehr aus, um alle benötigten Inhalte aus großen, komplexen und häufig schlecht strukturierten Datenmengen zu extrahieren und zu analysieren.

  • Infodienst-Trainee-StellenDer Artikel ist im Infodienst WILA Arbeitsmarkt erschienen. Jede Woche werden dort mehrere hundert Stellen zusammengestellt.
  • Die Abonnentinnen und Abonnenten erhalten so einen Überblick über den aktuellen Stellenmarkt, bleiben bei der Jobsuche am Ball - und kommen auch auf Jobs, nach denen sie gar nicht gesucht hätten.
  • Erstabonnent/innen können ein vierwöchiges Schnupperabo zum Preis von nur 10 € bestellen. Mehr Infos hier.

Repräsentative Umfragen des Digitalverbandes Bitkom weisen darauf hin, dass die deutsche Wirtschaft beim Thema Datenanalyse großen Nachholbedarf sieht. 45 Prozent der Unternehmen halten es für notwendig, Mitarbeiter/innen entsprechend weiterzubilden. Vor allem der Mittelstand sieht hier große Lücken. Doch auch ein Drittel aller großen Unternehmen wollen ihre Fähigkeiten zur Datenanalyse weiter verbessern. Besonders die Industrie will aktiv werden: 57 Prozent sehen beim Data Mining Handlungsbedarf, während es im Handel 41 Prozent und im Dienstleistungsbereich 38 Prozent sind.

„Im Prinzip besteht der Arbeitsmarkt für Datenanalysten aus zwei Segmenten", erläutert Lehner die Situation. „Zum einen sind viele kleine Dienstleistungsunternehmen am Start, die – teils mit eigenen, schon vorgefertigten Softwarelösungen – die Big Data Wünsche ihrer Kunden bearbeiten." In großen Unternehmen sei man dagegen in aller Regel längst dabei, die zur Datenanalyse benötigten Fähigkeiten selber aufzubauen. „Gleichzeitig werden dabei Datenmanagement und Datenanalyse in den Unternehmen oft organisatorisch integriert", fügt er hinzu.

Bis zu 10.000 Spezialistinnen und Spezialisten gesucht

„Es gibt eine ganze Menge kleinere Unternehmen am Markt für Dienstleistungen im Bereich Datenanalyse", bestätigt Mathias Bauer, Unternehmensleiter der Firma Mineway, mit der er bereits sowohl naturwissenschaftlich als auch kaufmännisch ausgerichtete Projekte abgeschlossen hat. „Wir hier in Saarbrücken sind mit unseren 35 Mitarbeitern durchaus typisch."

Das Arbeitsfeld sei noch vergleichsweise jung. Daher sei es nicht verwunderlich, dass es Schätzungen gebe, nach denen im Bereich Datenanalyse in Deutschland derzeit bis zu 10.000 Spezialistinnen und Spezialisten gesucht werden. „Und daher haben auch Quereinsteiger durchaus noch Chancen", hebt Bauer hervor. Zwar seien bei Mineway derzeit keine grünen Fachleute im Team, aber das könne sich jederzeit ändern.

„So etwas hängt natürlich von den Projekten ab, die man macht", fährt Bauer fort. Mineway habe beispielsweise unlängst ein Vorhaben bewältigt, in dem etwa tausend Windkraftanlagen in einer Gesellschaft zusammengelegt werden sollten. Doch wiesen nicht nur die Windräder erhebliche Typenunterschiede auf. Auch wurden sie durch verschiedene Regionalgesellschaften betrieben; alle mit unterschiedlicher Unternehmenskultur. Da zukünftig nicht nur die kaufmännischen, sondern auch die technischen Angelegenheiten wie die Wartung der einzelnen Anlagen zentral gesteuert werden sollten, mussten in einem ersten Schritt alle Wartungsprotokolle und Störungsmeldungen zentral erfasst und in elektronischer Form zur Verfügung gestellt werden. Vieles davon wollte man zudem aus juristischen Gründen dauerhaft sichern. „Für solch ein Projekt braucht man natürlich Ingenieure, die sich mit Windrädern auskennen", macht Bauer deutlich.

Zentrale Wartung von Windkraftanlagen

„Die Dokumente lagen zwar in elektronischer Form vor, aber als Formulare und Formblätter in Word, Excel, PDF oder als Scans in verschiedenen Grafikformaten", erinnert sich Bauer. Zudem enthielten die Dokumente teilweise frei formulierte Einträge – beispielsweise bei der Beschreibung von Störungen an einer Anlage –, die inhaltlich erfasst und in ein übergeordnetes Erfassungsschema eingefügt werden mussten. Dazu wurde jedem Dokument ein entsprechendes Analyse-Modul zugeordnet, mittels dessen die wesentlichen Inhalte extrahiert und in einer Datenbank abgelegt wurden.

„Natürlich haben wir zur Texterkennung auf OCR -Tools zur Schrifterkennung zurückgegriffen, aber wir mussten außerdem auch natürliche Sprache weiterverarbeiten", ergänzt Bauer. „Das ist viel komplexer, als zum Beispiel nur Daten aus einem Multiple-Choice Fragebogen auszuwerten." Schließlich seien die Dokumente so miteinander verknüpft worden, dass jetzt beispielsweise das Auftreten gleicher Begriffe oder Objekte an unterschiedlichen Stellen nachverfolgt werden könne. So sei man nun in der Lage, das technische und das kaufmännische Management sämtlicher Windkraftanlagen über eine zentrale Datenbank und mittels vereinheitlichter IT-Tools zu erledigen.

Lesen Sie außerdem:

Die Vorgehensweise von Mineway entspricht gängigen Abläufen: Wenn ein grober Überblick über das vorhandene Datenmaterial gewonnen ist, gilt es, zunächst zu filtern: also die relevanten Datensätze zu finden. Dann müssen die noch zu untersuchenden Informationen extrahiert und auf ihre Richtigkeit hin überprüft werden. Zudem ist es wichtig, – wo möglich – Lücken zu schließen oder fehlende Werte mittels spezieller mathematischer Verfahren zu schätzen. Die geprüften, zusammengefassten und methodisch gesicherten Datensätze können dann auf themenspezifische Zusammenhänge und Gesetzmäßigkeiten hin untersucht werden.

Mit Hilfe der richtigen Fragen und geschickt eingesetzten mathematischen Methoden können darüber hinaus verborgene Muster und Beziehungen der einzelnen Informationen untereinander aufgedeckt werden. Je nachdem, welche Daten zur Verfügung stehen und abhängig davon, was man sucht, lassen sich so neue und produktions-, vertriebs- oder marketingrelevante Erkenntnisse gewinnen. Im besten Fall lassen sich mit Data Mining Prognosen auf zukünftige Trends erstellen. Die Qualität solcher Prognose-Algorithmen lässt sich wiederum anhand der neu hereinkommenden Daten überprüfen und verbessern.

Kaufmännisches Wissen gefragt

Doch nicht alle Data-Mining-Unternehmen stehen Naturwissenschaftler/innen als potentielle Angestellte so offen gegenüber. „Wir nehmen zwar auch Quereinsteiger", sagt Karl-Joseph Schiffhauer, Chef von SITACS, Schiffhauer IT-Auditing Consulting & Solutions. „Aber bei uns kommt es auf kaufmännisches Fachwissen an. Deshalb nehmen wir nur Leute, die die Geschäftsprozesse vor allem in Banken und Versicherungen genau kennen. „Allgemein sind Datenanalytiker allerdings recht gesucht, und dementsprechend können die Leute auch vergleichsweise hohe Vergütungen fordern", ergänzt Schiffhauer. Das Einstiegsgehalt betrage selten unter 40.000 Euro im Jahr; später seien 60.000 Euro üblich, aber durchaus auch bis 80.000, positionsabhängig sogar über 90.000 Euro möglich.

Diese Zahlen bestätigt Kathrin Schäfer von der Personalabteilung der Firma „Additive – Soft- und Hardware für Technik und Wissenschaft GmbH": „Bei uns fängt man mit etwa 45.000 Euro Jahresgehalt an", sagt sie. Ganz genau sei das aber nicht festgelegt, da das Gehalt aus einem Fixum und einer Umsatzbeteiligung zusammengesetzt sei. „Durch den variablen Anteil ist der Verdienst bei uns nach oben praktisch offen", betont sie. Bei Additive würden regelmäßig Naturwissenschaftler/innen verschiedenster Disziplinen gesucht. Im Moment seien vor allem Chemiker/innen gefragt, aber auch ein Biologe sei im Unternehmen tätig. „Viele kommen aus der Forschung, manche aber auch direkt nach ihrem Abschluss aus der Universität zu uns", ergänzt sie.

„Daten können bares Geld wert sein", weiß Lehner aus Erfahrung. „Doch der Weg dahin ist lang." Die meisten Unternehmen unterhielten ein halbes Dutzend unterschiedlicher Archive oder mehr. Zwar werde – über die betrieblichen erzeugten Dateien hinaus – fast alles archiviert wie E-Mails,  Sicherheitsprotokolle und Callcenter-Aufzeichnungen, aber nur wenige Unternehmen seien in der Lage, wichtige Informationen bei Bedarf schnell wiederaufzufinden und darauf zuzugreifen.

„Erschwert wird die innerbetriebliche Datenverwaltung dadurch, dass verschiedenen Abteilungen uneins über Prioritäten, Kompetenzen und Zuständigkeiten beim Datenmanagement sind", so Lehner. Besondere Bedeutung haben die Daten für die Rechts- und die IT Abteilung, deren Nutzungsvorstellungen jedoch ziemlich unterschiedlich ausfielen. Die Rechtsabteilungen bräuchten die archivierten Datenbestände etwa für Betriebsprüfungen und als Beweismittel. Für die IT-Abteilungen stehe dagegen der geschäftliche Nutzen im Vordergrund.

Gutes Datenmanagement spart Geld

Der unternehmerische Wert vorhandener Datenbestände kann ganz erheblich sein. Studien weisen darauf hin, dass dieser vor allem in den Einsparpotentialen liegt. Nach einer vielzitierten Untersuchung der International Data Corporation von 2015 wurden bei gutem Datenmanagement im Durchschnitt zwischen 800.000 und neun Millionen US-Dollar eingespart; und zwar vor allem durch Risikominderung und Vermeidung von Rechtsstreitigkeiten sowie durch Senkung der Arbeits-, Betriebs- oder Kapitalkosten. Zwar wurden auch zusätzliche Umsätze durch adäquates Datenmanagement erzielt, aber diese machten maximal ein Viertel der möglichen Ertragssteigerungen aus.

„Größere Unternehmen und Konzerne sind bestrebt, ihre Bedürfnisse im Bereich Datenmanagement und Datenanalyse mit eigenen Mitteln zu bewältigen", ergänzt Lehner. Zu einer umfassenden betrieblichen Strategie im Bereich Datenarchivierung und -nutzung gehöre zunächst, eine betriebliche Informationskarte zu erstellen, die Aufschluss über alle Datenbestände und -quellen eines Unternehmens gibt sowie über ihre Aufbewahrungsorte und über ihre Bedeutung. „Außerdem müssen die Aufbewahrungsfristen erfasst werden, und es sollte möglich sein, Rückschlüsse auf bisherige Anwendungsfälle, den möglichen Wert der Daten, die verschiedenen Zugänge zu ihnen und die Archivierungskosten zu ziehen", fährt Lehner fort. Um alle diese Aufgaben zu bewältigen, sei es für größere Betriebe sinnvoll, die entsprechenden Aufgaben und Kompetenzen auch personell zu bündeln.

Nicht nur analysieren, sondern auch erklären

„Ein guter Datenanalyst ist, wer schnell und kompetent auf das mathematische Repertoire zurückgreifen kann", veranschaulicht Kathrin Schäfer die Aufgaben. „Und tatsächlich gibt es sie noch", freut sie sich, „diese bärtigen Nerds mit T-Shirt, die innerhalb kurzer Zeit mit Hilfe von frei verfügbaren Tools und Technologien gescheite Schlüsse aus dem vorhandenen Material ziehen können und diese anschließend sogar anschaulich visualisieren und erklären."

Zudem fungieren die Datenspezialisten als Schnittstelle zwischen der IT und anderen Abteilungen. „Sie sind auch so etwas wie Dolmetscher." Denn sie formulieren lesbare Ergebnisse aus der Datenmasse. Dies kann für die Produktion genauso hilfreich sein wie für die Rechts-, Finanz- oder Marketingabteilung. Die Übertragungstätigkeit erfolgt aber auch in umgekehrter Richtung: „Ein Datenanalyst muss in der Lage sein, die Anforderungen der verschiedenen Abteilungen so zu vermitteln, dass die IT-Abteilung damit etwas anfangen kann", resümiert Schäfer.

Der Datenanalyst erstelle einerseits also eine Informationsplattform, auf die Mitarbeiter/innen und Unternehmensleitung für ihre jeweiligen Zwecke zugreifen können. Andererseits könne er neue Erkenntnisse aus dieser Plattform schöpfen. „Streng genommen existieren in mittleren und großen Unternehmen vier Aufgabenbereiche im Zusammenhang mit Datenanalyse: Da ist zum einen die Versorgung mit Daten in nutzbaren Formaten, zweitens die Vermittlung zwischen den verschiedenen Fachbereichen", fasst Lehner zusammen. Drittens gebe der Data Scientist auf Grundlage von Daten Antworten auf analytische Fragestellungen und er überwache viertens Datenqualität und -integrität. Außerdem müssten sämtliche Ergebnisse so aufbereitet werden, dass sich daraus Handlungsempfehlungen ableiten lassen.

Neue Berufsbilder: Data Scientist und Data Analyst

Die neuen Aufgabenfelder haben mittlerweile für die Entstehung eines neuen Berufsbildes, dem des Datenanalyst/innen, gesorgt. Nicht nur an und in den Universitäten ist von Datenwissenschaftler/innen (Data Scientists) die Rede. Auch Wirtschaftsunternehmen sind zunehmend auf der Suche nach entsprechenden Fachkräften.

Im englischsprachigen Bereich werden etwas andere Unterscheidungen getroffen: Hier gibt es zum einen den Data Scientist, der für die Analyse großer Datenmengen zuständig ist und dafür auch neue Algorithmen erstellen kann. Dagegen ist der Data Analyst eher eine Art fortgeschrittener Anwender in diesem Bereich und arbeitet mit vorhandenen Werkzeugen. Diese beiden Profile werden wiederum von denen der verschiedenen Business Analysten unterschieden, die für sämtliche Aspekte des Wirtschaftens – einschließlich finanzieller, produktbezogener und marketingrelevanter Fragen – zuständig sind.

„Mittlerweile gibt es mindestens zehn verschiedene Vertiefungsrichtungen für Datenanalysten", betont Lehner. Fälschlicherweise werde oft angenommen, dass Statistikkenntnisse der einzige Schlüssel zum Erfolg in diesem Berufsfeld seien. Doch entsprechende Verfahren kämen immer häufiger vorgefertigt „aus der Box". „Der Knackpunkt sind die ingenieurtechnischen IT-Kenntnisse", ist sich Lehner sicher.

Der Quereinstieg für grüne Fachleute sei am besten mit Praxiserfahrung aus der Anwendung heraus möglich, denn dann könnten sie mit passendem Fachwissen aufwarten. Das Windkraftbeispiel von Herrn Bauer aus Saarbrücken sei durchaus aussagekräftig für die Branche. „Wer wirklich als Datenanalyst einsteigen will, sollte entsprechende Fernkurse des Massachusetts Institute of Technology oder der Stanford Universität belegen", rät Lehner. „Vor allem aber brauchen Quereinsteiger Kenntnisse in der Programmiersprache ‚R'. Diese freie Toolbox ist der Schlüssel zum Umgang mit unübersichtlichen, diversen und riesigen Datenbeständen", schließt Lehner.

 

Weitere WILA-Angebote