Data Science bedeutet auf Deutsch übersetzt Datenwissenschaft. Erstmals wurde der Begriff in den 60er-Jahren verwendet – zu diesem Zeitpunkt allerdings als Synonym für Informatik. Mittlereile ist der Begriff weit umfassender, sodass die Datenwissenschaft eine eigenständige Fachdisziplin darstellt1.
Data Science stellt eine Schnittmenge zwischen Statistik, künstlicher Intelligenz (KI), Datenanalyse und wissenschaftlichen Methoden dar, um Werte aus Daten zu gewinnen. Es beinhaltet die Aufbereitung von Daten für die Analyse. Dazu zählen die Bereinigung, Aggregation und Bearbeitung von Daten, um weitere Analysen zu vollziehen.
Data Science zählt zu den interessantesten Gebieten, weil Unternehmen auf einem enormen Datenschatz sitzen. Das Datenvolumen hat in den letzten Jahren stark zugenommen, da durch neue Technologien die Erstellung und Speicherung diverser Daten ermöglicht wurde. Ein Beispiel hierfür ist Facebook: Auf der Social Media Plattform werden pro Stunde 10 Millionen Fotos hochgeladen.
Daten wie diese sind aber meistens unberührt und liegen nur in Datenbanken und Data Lakes ab. Nur wer die Vielzahl an Daten richtig deuten kann, gewinnt an Vorteilen. An dem Punkt kommt Data Science ins Spiel2.
Inhaltsübersicht
- Was sind die Ziele von Data Science?
- Wie wird Data Science genutzt?
- Welche Aufgaben hat ein Data Scientist?
- Welche Bedeutung hat Data Science in Bezug auf Big Data?
- Was ist der Unterschied zwischen Data Science, künstlicher Intelligenz und Maschinellem Lernen?
- Wo wird Data Science in der Praxis angewendet?
- Tools für Data Science
Mit Brunel finden Sie die passenden Experten für Ihr Projekt
Sie planen ein Projekt im Bereich Data Science und sind noch auf der Suche nach den passenden Experten? Mit unseren hochqualifizierten Spezialisten aus den Bereichen Informatik, Mathematik, Physik, Statistik, Datenmanagement und der Elektrotechnik bringen wir Ihr nächstes Projekt im Bereich Data Science auf das nächste Level. Informieren Sie sich in diesem Zusammenhang auch über unser Leistungsspektrum in den Bereichen Arbeitnehmerüberlassung, Werk- und Dienstverträge.
Was sind die Ziele von Data Science?
Data Science verfolgt das Ziel, aus Daten Wissen zu generieren, um so die Unternehmenssteuerung zu optimieren und bei der Entscheidungsfindung zu unterstützen. Die enormen Datenmengen werden mit Maschinellem Lernen und Künstlicher Intelligenz im Big-Data Umfeld analysiert.
Die Ziele im Überblick:
- Datenbestand analysieren und Wissen generieren
- Aus Daten Handlungsempfehlungen ableiten
- Bei der Entscheidungsfindung unterstützen
- Unternehmensprozesse optimieren und automatisieren
- Unternehmenssteuerung unterstützen
- Erstellung von Prognosen
- Ereignisse in der Zukunft voraussagen3
Wie wird Data Science genutzt?
Ein klassischer Data-Science-Ablauf für ein Datenmodellierungsprojekt:
1. Planung:
Das Projekt und die möglichen Ergebnisse müssen festgelegt werden.
2. Erstellen eines Datenmodells:
Oft wird eine Vielzahl von Open-Source-Bibliotheken und interner Tools genutzt, um Modelle des Machine-Learning einzurichten. Anwender bevorzugen es, wenn Programmierschnittstellen bei der Datenerfassung, Datenprofilerstellung und -visualisierung unterstützen. Es erfordert die richtigen Tools und der Zugriff auf die relevanten Daten und weitere Ressourcen, um erfolgreich starten zu können.
3. Die Bewertung eines Modells:
Ehe das Modell eingesetzt werden kann, muss der Data Scientist eine hohe Sorgfalt für das Modell aufweisen. Um ein ideales Verhalten in der Produktion zu ermöglichen, werden Modellbewertungen anhand von Bewertungsmetriken und -visualisierungen durchgeführt, um die Modell-Performance mittels neuer Daten zu messen und zu bewerten.
4. Modelle erklären:
Früher war es aus menschlicher Sicht nicht möglich, interne Mechanismen der Ergebnisse von Machine-Learning-Modellen zu definieren. Data Scientists möchten automatisierte Erklärungen der Gewichtung und Bedeutung von Faktoren haben, die bei Prognosen einfließen und spezifische Details zu Modellvorhersagen betreffen.
5. Bereitstellung eines Modells:
Um ein trainiertes Maschine-Learning-Modell mit dem richtigen System zu verbinden, bedarf es oft sehr viel Zeit und Geduld. Dies kann durch skalierbare und sichere Programmierschnittstellen oder durch interne Datenbanken der Machine-Learning-Modelle erzielt werden.
6. Überwachung eines Modells:
Nach der Bereitstellung folgt die Überwachung eines Modells, die zwingend erforderlich ist. So wird sichergestellt, dass die Modelle problemlos funktionieren4.
Welche Aufgaben hat ein Data Scientist?
Ein Data Scientist, auf Deutsch übersetzt Datenwissenschaftler, beschäftigt sich mit der Analyse von Daten aus unterschiedlichen Quellen, um daraus Wissen zu generieren.
Mehr zum Jobprofil des Data Scientist findet ihr hier.
Welche Bedeutung hat Data Science in Bezug auf Big Data?
Big Data ist ein wichtiges Thema in Bezug auf Data Science. Durch die konstante Zunahme der zu verarbeitenden und zu analysierenden Daten etablierte sich der Begriff Big Data. Dieser beschäftigt sich mit Methoden, Verfahren, technischen Lösungen sowie IT-Systemen. Sie sollen die Datenflut regulieren und die enormen Datenmengen verarbeiten, indem die Daten, ob strukturiert oder unstrukturiert, durch Wissen und Methoden verarbeitet und analysiert werden. Data Science nutzt dafür beispielsweise Künstliche Intelligenz und Maschinelles Lernen5.
Was ist der Unterschied zwischen Data Science, künstlicher Intelligenz und Maschinellem Lernen
Künstliche Intelligenz und Maschinelles Lernen sind wichtige Begriffe in Bezug auf Data Science. Darum ist es wichtig, diese richtig zu verstehen und die Nuancen zu kennen.
- Künstliche Intelligenz bedeutet, einen Computer zu animieren, das menschliche Verhalten teilweise nachzumachen
- Ein Teilbereich der Künstlichen Intelligenz ist Data Science. Es stellt eine Schnittmenge zwischen Statistik, künstlicher Intelligenz, Datenanalyse und wissenschaftlichen Methoden dar, um Werte aus Daten zu gewinnen
- Ein weiterer Teilbereich der Künstlichen Intelligenz ist Maschinelles Lernen. Dies setzt sich zusammen aus der Technik, mit dem Computer Dinge aus Daten ableiten und so KI-Anwendungen starten können6.
Wo wird Data Science in der Praxis angewendet?
Im Abschnitt zuvor wurde der Unterscheid zwischen den Begriffen Data Science, künstliche Intelligenz und Maschinellem Lernen erklärt. Doch wo begegnen uns diese Begriffe im Alltag?
- Virtuelle Assistenten: Alexa und Siri sind weltbekannt. Durch sie wird die Benutzung von mobilen Endgeräten vereinfacht. Die Geräte verstehen die menschliche Sprache und können sie verarbeiten.
- Chatbots: Im Kundenservice fallen viele Routineaufgaben an, die von Chatbots übernommen werden können. So hat der Mitarbeiter im Kundenservice mehr Zeit für die individuelle Kundenbetreuung.
- Empfehlungssysteme: Empfehlungssysteme lernen den Geschmack von einzelnen Kunden kennen und können diesem so individuelle Angebote präsentieren.
- Gesichtserkennung: Angesichts der künstlichen Intelligenz können Systeme im Rahmen der Bilderkennung Gesichter erkennen und diese zuordnen.
- Betrugserkennung: Künstliche Intelligenz wird im Bereich der Kriminalitätsbekämpfung eingesetzt. Insbesondere von Finanzdienstleistern, Banken und weiteren Unternehmensbranchen.
- Autonomes Fahren: Dank intelligenter Systeme können Autos Sicherheitsabstände und die Fahrspur einhalten. In Zukunft soll es sogar vollautomatisierte Fahrzeuge geben7.
Tools für Data Science
Es ist ein komplexer Prozess, um die Modelle zu erstellen, zu bewerten, bereitzustellen und zu überwachen. Darum gibt es Data Science-Tools. Oft nutzen Data Scientists Open-Source-Notebooks – Webanwendungen um Codes zu schreiben und auszuführen sowie Daten und Anzeigen zu visualisieren.
Jupyter, RStudio und Zeppelin Notebooks sind die beliebtesten. Sie sind sehr nützlich, wenn Analysen durchgeführt werden müssen, kommen jedoch schnell an ihre Grenzen, wenn Datenwissenschaftlicher im Team arbeiten müssen. Um diesem Hindernis aus dem Weg zu gehen, wurden Plattformen für die Datenanalyse entwickelt.
Was sind Datenanalyse-Plattformen?
- Software-Hubs bilden das Zentrum für Projekte
- Unternehmen erhalten so schneller und effizienter Wissen aus den Daten8
Quellen:
Was ist Data Science?. BIGDATA INSIDER. Veröffentlicht: 18.11.2020, Abrufdatum: 20.12.2021 (Link)
Was ist Data Science?. Oracle Deutschland. Abrufdatum: 20.12.2021 (Link)
Was ist Data Science?. BIGDATA INSIDER. Veröffentlicht: 18.11.2020, Abrufdatum: 20.12.2021 (Link)
Was ist Data Science?. Oracle Deutschland. Abrufdatum: 20.12.2021 (Link)
Was ist Data Science?. BIGDATA INSIDER. Veröffentlicht: 18.11.2020, Abrufdatum: 20.12.2021 (Link)
Was ist Data Science?. Oracle Deutschland. Abrufdatum: 20.12.2021 (Link)
Was ist Data Science? Definition, Tätigkeiten eines Data Scientist und Beispiele. datasolut. Abrufdatum: 20.12.2021 (Link)
Was ist Data Science?. Oracle Deutschland. Abrufdatum: 20.12.2021 (Link)