Open Source im professionellen Einsatz
Linux-Magazin Microsoft/

Hadoop und Mahout auf Microsoft Azure

Data Mining im Cluster

Hadoop und Mahout sind Open-Source-Projekte der Apache Software Foundation, die sich mit der verteilten Verarbeitung großer Datenmengen beschäftigen. Die Microsoft-Evangelistin Olivia Klose erklärt in mehreren Blogeinträgen, wie man die Software unter Azure in Betrieb nimmt.

229

Während die Hadoop-Distribution HDInsight die übliche Art ist, die Software auf Azure zu betreiben, wählt Klose einen Linux-basierten Ansatz mit größerer Flexibilität. Sie verwendet Hortonworks Data Platform 2.1 für Linux auf einem Centos-6.5-Image von Open Logic.

Die Blogserie zu Hadoop erläutert zunächst das Einrichten der Infrastruktur inklusive des virtuellen Netzwerks und eines eigenen DNS-Servers, Storage sowie der Linux-VM. Dann entstehen Master- und Worker-Knoten für das verteilte System. Zur Installation des Hadoop-Clusters dient schließlich das GUI-Tool Ambari, ebenfalls aus dem Hause Apache. Olivia Kloses ausführliche Anleitung zeigt einen Schritt nach dem anderen und ist reichlich mit Screenshots und Listings ausgestattet.

Die Weboberfläche von Apache Ambari hilft bei der Hadoop-Installation.

In einer anderen Reihe von Einträgen wählt die Microsoft-Bloggerin HDInsight, um ein weiteres Mitglied der Hadoop-Familie zu benutzen: Apache Mahout ist eine skalierbare Bibliothek für maschinelles Lernen und Data Mining. Derartige Software arbeitet hinter den Kulissen, wenn Online-Shops weitere Kaufempfehlungen unter einem Produkt einblenden. Olivia Klose begleitet den Leser durch das Anlegen eines Clusters und die Mahout-Installation. Dann zeigt sie an Beispieldaten, wie man eine Auswertung mittels Hadoop-Kommandozeile oder Powershell durchführt.

Wer diese oder ähnliche Anwendungsbeispiele ausprobieren möchte, kann sich für ein kostenloses einmonatiges Evaluationskonto für Microsoft Azure anmelden. Die Microsoft IT Pro Academy bietet kostenloses Lernmaterial zum Thema im Bereich Cloud OS.

Linux-Magazin kaufen

Einzelne Ausgabe
 
Abonnements
 
TABLET & SMARTPHONE APPS
Bald erhältlich
Get it on Google Play

Deutschland

Ähnliche Artikel

comments powered by Disqus

Microsoft TechNet News