Open Source im professionellen Einsatz
Linux-Magazin 01/2017

Datenwissenschaft für Laien und angehende Programmierer

Tux liest

Zwei Bücher – vom selben Verlag, aus derselben Reihe und zu einem ähnlichen Thema, aber mit recht unterschiedlichen Blickwinkeln: Data Science im theoretischen Überflug und als Fingerübung.

689

Eine kurze Einführung in ein großes Wissensgebiet, die noch dazu mit dem Anspruch auftritt, ohne Vorkenntnisse verständlich zu sein, ist zwangsläufig eine Gratwanderung: Taucht sie zu tief in die Materie ein, kommt sie mit dem Platz nicht aus oder muss Vorkenntnisse voraussetzen. Schwimmt sie zu sehr an der Oberfläche, ist sie schnell banal und nutzlos. Auch die beiden vorliegenden Einführungen in Data Science üben sich in diesem Spagat.

Wenig Praxisnutzen

Das Werk von Lilian Pierson "Data Science für Dummies" befleißigt sich eines lockeren Tonfalls, der aber nicht über die Stränge schlägt. Dafür ist er oft distanzlos, unkritisch und vollmundig, etwa wenn das Buch auf Seite 29 postuliert, die Verwendung einer datenzentrierten Sichtweise würde nicht nur die Rendite optimieren, die Effizienz steigern und einen Wettbewerbsvorteil garantieren, sondern auch – Gipfel der Bescheidenheit – "Die Welt zu einem besseren Platz für diejenigen machen, die weniger wohlhabend sind". Halleluja!

Immer wieder stößt man auf Tautologien und Zirkelschlüsse. Beispiel: "Tatsache ist: Um weiter aktuell zu bleiben, müssen Sie nur die Zeit und die Anstrengung aufbringen, um die Fähigkeiten zu erwerben, die Sie auf dem Laufenden halten." Und was den Spagat betrifft: Das Buch vermittelt eine vage Ahnung vom Gegenstand des Data Engineering und den wichtigsten Techniken: Statistik, Klassifikationsverfahren, mathematische Modelle, Visualisierung. Weiter streift es die Programmierung und skizziert einige praktische Anwendungen für Big Data.

Nach der Lektüre hat man die einschlägigen Buzzwords schon einmal gehört, viel mehr aber auch nicht. Wofür ein Statistiklehrbuch ganze Kapitel reserviert, wird hier in fünf Sätzen abgehandelt. Anwendungsbereites Wissen lässt sich so nicht vermitteln. Ganz zu schweigen davon, dass entgegen den marktschreierischen Prophezeiungen selbst die formale Beherrschung der Techniken oft weniger als die halbe Miete wäre, der Leser müsste sie dann erst noch richtig verwenden und die aus ihnen gewonnenen Schlüsse erst noch praktisch umsetzen.

Kurz: Wer sich eine ungefähre Vorstellung davon machen will, warum man Daten als Gold dieser Tage behandelt und was ein Datenanalyst prinzipiell mit ihnen anstellen kann, der wird hier annehmbar bedient. Wissen, das er danach selbstständig praktisch anwenden kann, um Nutzen aus Daten zu ziehen, wird er dagegen kaum erwerben.

Konkrete Schnipsel

"Data Science mit Python für Dummies": Das zweite Buch geht bei einem ganz ähnlichen Thema ganz anders vor: Es erläutert Analysetechniken anhand von Codeschnipseln. Das macht die Darstellung wesentlich konkreter. Dabei muss es aber auch Kompromisse eingehen und sich auf die Anfangsgründe beschränken – zumal es sich auch noch eine eigene Einführung in Python leistet.

Daher ist auch hier nicht viel mehr möglich als eine Anregung für weitergehende Studien. Aber diese Anregung wird durch reale Codebeispiele viel fasslicher und durch die eigene Mitwirkung, wenn der Leser Beispiele ausführt und erweitert, auch nachhaltiger. Schließlich bekommen die Autoren auch die Komplexität besser in den Griff, da sie viel Gebrauch von Python-Bibliotheken machen, die eine Menge Details hinter mächtigen Funktionen verstecken.

Was bei der Lektüre generell auffällt, ist die Konzession an den Umfang, die auch dieser Titel machen muss. Während das Was und Wie in vielen Fällen anhand der Beispiele noch ganz gut erklärt wird, fehlt es oft am Warum und Wieso. Mögliche Lösungen werden präsentiert, aber nicht hergeleitet, Techniken werden empfohlen, aber nicht begründet.

Das birgt die Gefahr, dass sich der Leser etwas aneignet, das er danach kennt, aber nicht versteht. Zudem blenden die Autoren einige der wichtigsten Dimensionen des Themas komplett aus, etwa die Datensicherheit oder ethische und juristische Fragen der Datenerhebung.

Das alles ist kein Wunder, eher ein systematisches Problem der Buchreihe: Dem unbedarften Leser, an den sie sich wendet, kann man auf 400 Seiten womöglich den Einstieg in eine Programmiersprache vermitteln, aber nicht den Stoff eines Master-Studiengangs.

Info 1

Lilian Pierson:

Data Science für Dummies

Wiley Verlag, 2016

375 Seiten

27 Euro

ISBN: 978-3-527-71207-6

Info 2

J. P. Mueller, L. Massaron: Data Science mit Python für Dummies

Wiley Verlag, 2016

420 Seiten

27 Euro

ISBN: 978-3-527-71209-3

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 1 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Bücher

    Ein Buch diskutiert die Messbarkeit von Programmierleistungen: Lässt sich Effizienz beim Coden beziffern? Ein zweites Buch begleitet bei den ersten Schritten in Python.

  • Bücher

    Wer ganz ohne Vorkenntnisse neu in ein Themengebiet einsteigen will, der ist bei der "Für Dummies"-Reihe gut aufgehoben. Diesmal für Dummies: der Raspberry Pi. Das zweite Buch richtet sich eher an gestandene Software-Entwickler. Sein Thema: agiles Testen.

  • Bücher

    Ein Buch führt in die Thematik vorausschauender Datenanalysen ein, ein zweites hilft beim Pauken für die Linux-Zertifizierungen des Linux Professional Institute.

  • Tux liest

    Zwei Bücher möchten Novizen die Weisheit der Meister vermitteln. Bei Eric Meyer geht es um angewandtes Webdesign mit Cascading Stylesheets. Auch Greg Wilson plaudert in seinem englischsprachigen Buch aus dem Nähkästchen und zeigt, wie er Daten rasch in die gewünschte Form bringt.

  • Bücher

    Ein neu übersetztes Buch möchte Statistik mit Hilfe von Python-Programmen anschaulich machen. Der zweite Titel treibt die Metaprogrammierung mit C++-Templates zur Meisterschaft.

comments powered by Disqus

Stellenmarkt

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.