Open Source im professionellen Einsatz
Linux-Magazin 07/2016

Über Data Mining mit Python und über Samba 4

Tux liest

Ein Buch führt in die Kunst der Datenanalyse ein und bietet einen umfassenden Überblick, das andere widmet sich der Administrationspraxis mit Samba 4.

635

Schon vor dem großen Hype um Big Data gab es Bücher, die sich mit der Aufbereitung und Analyse von Daten in einer Skriptsprache beschäftigten. Eines der vielleicht ersten war 2001 "Data Munging With Perl" von David Cross. Es beschrieb Konvertierung, Pattern Matching oder Parsing für strukturierte und unstrukturierte Daten. Inzwischen ist es in Teilen überholt, aber neue Titel kamen nach, darunter das aktuelle "Einführung in Data Science" von Joel Grus.

Data Mining mit Python

Das Buch von Grus unterscheidet sich in zweierlei Hinsicht von dem Vorläufer: Es verwendet statt Perl das inzwischen etwas populärere Python und nimmt ein ungleich größeres Themenfeld in den Blick. Wo es dem Perl-Buch vor allem um die klassischen ETL-Prozesse ging (Extract, Transform, Load), die auch in dem Python-Werk vorkommen, behandelt letzteres außerdem die Visualisierung, viele Methoden der statistischen Analyse, die linguistische Datenverarbeitung, Clustering, Graphenanalyse bis hin zu Map-Reduce-Techniken.

Dabei muss es natürlich Kompromisse machen, denn jedes der einzelnen Kapitel böte genug Stoff für eigene Bücher. Daher verweist ein eigener Absatz unter der Überschrift "Weiterführendes Material" am Ende jedes Kapitels auf vertiefende Lektüre. Von der muss sicher auch Gebrauch machen, wer mehr als einen ersten Eindruck von dem jeweiligen Fachgebiet bekommen will.

Das Buch ist prinzipiell ohne spezielle Vorkenntnisse verständlich. Selbst mit Python muss der Leser keine Erfahrung haben, das zweite Kapitel bietet einen Crashkurs in dieser Skriptsprache. Eine gute Portion Verständnis für Mathematik macht den Stoff jedoch ganz sicher zugänglicher. Zumal der Autor häufig nur einzelne Funktionen demonstriert, die für sich genommen noch kein vollständiges Programm darstellen.

Die Einführung in Data Science ist für jeden eine empfehlenswerte Lektüre, der sich in das spannende und aufstrebende Gebiet des Data Mining einlesen will. Es vermittelt einen ersten, fundierten Überblick, auf dem der Leser aufbauen kann, um später die Themen zu vertiefen, die ihn besonders interessieren. Neugier und Lernbereitschaft sind aber Voraussetzungen, um mit dem Buch Spaß zu haben.

Alles über Samba 4

Der Autor und Linux-Trainer (bei der Heinlein Akademie) Stefan Kania hat das erste deutschsprachige Buch zu Samba 4 geschrieben, das eben in zweiter Auflage bei Rheinwerk herauskam. Das Buch umfasst alle Neuerungen bis zu Samba 4.3, das erst im September 2015 erschien. Es wendet sich an Administratoren, die Linux-Know-how bereits mitbringen und auch allgemeines Grundlagenwissen der Informatik parat haben sollten.

Was Samba betrifft, wird alles gründlich und von Anfang an erläutert. Nach einem Überblick über die Protokolle startet es mit der Installation. Weiter geht's mit dem Einrichten eines ersten Domaincontrollers. Die Erläuterungen sind praxisorientiert und lassen sich parallel zur Lektüre mitvollziehen. Auf Stolperstellen weist der Autor gesondert hin.

Im Anschluss behandelt es die nötigen Benutzeraccounts und deren Verwaltung mit verschiedenen Werkzeugen unter Linux und Windows. Damit in Verbindung stehen die Gruppenrichtlinien, die Kapitel 5 erläutert. Vor allem reine Linux-Admins betreten hier Neuland, erhalten aber ausreichend Hilfestellung.

Um die Einrichtung und Verwaltung zusätzlicher, redundanter Domaincontroller geht es im nächsten Kapitel. Danach kommen endlich die Fileserver an die Reihe, die eigentlichen Arbeitspferde. Deren Konfiguration behandeln auch das nächste Kapitel über das Rechtesystem von Samba und seine Quotas sowie das übernächste über die Linux- und Windows-Clients der Domäne nebst Spezialitäten wie dem ID-Mapping.

Anspruchsvoll wird es im 11. Kapitel, das Samba-Cluster am Beispiel einer Installation auf der Grundlage von Gluster-FS diskutiert. Die folgenden Kapitel haben dann mit einigen Problemen in Bezug auf Active Directories zu tun (Schema-Erweiterung, Vertrauensstellung, Domänenmigration). Schließlich wird auch noch Samba als Printserver besprochen. Ein Workshop-Teil, der alles noch einmal in einem durchgehenden Beispiel zusammenfasst, beschließt das Buch.

Info 1

Joel Grus:

Einführung in Data Science

O'Reilly, 2016

350 Seiten, 35 Euro

ISBN: 978-3960090212

Info 2

Stefan Kania:

Samba 4

Rheinwerk, 2016

470 Seiten

50 Euro

ISBN: 978-3836242462

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 1 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

  • Tux liest

    Zwei Bücher möchten Novizen die Weisheit der Meister vermitteln. Bei Eric Meyer geht es um angewandtes Webdesign mit Cascading Stylesheets. Auch Greg Wilson plaudert in seinem englischsprachigen Buch aus dem Nähkästchen und zeigt, wie er Daten rasch in die gewünschte Form bringt.

  • Bücher

    In den Taschen der Mitmenschen stecken allerhand mobile Geräte und Betriebssysteme. Das erste vorgestellte Buch möchte mit HTML 5 Apps schreiben, die überall dort laufen. Der zweite Titel bringt mit Python und den passenden Bibliotheken dem Computer das Sehen bei.

  • Tux liest

    Administratoren lieben praktische Anleitungen für ihren Alltag. Doch das beste Rezeptbuch nützt wenig, wenn es nicht auch hinter die Kulissen schaut. Das aktualisierte Samba-Buch von Volker Lendecke und ein neuer Band mit Server-Hacks versuchen die Gratwanderung.

  • Bücher

    Ein Buch diskutiert die Messbarkeit von Programmierleistungen: Lässt sich Effizienz beim Coden beziffern? Ein zweites Buch begleitet bei den ersten Schritten in Python.

  • Bücher

    Der Versuch, ein Buch über eine Windows-Software auch unter Linux zu nutzen, und eine leicht verständliche Einführung in die Linux-Welt.

comments powered by Disqus

Ausgabe 11/2017

Digitale Ausgabe: Preis € 6,40
(inkl. 19% MwSt.)

Stellenmarkt

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.