Open Source im professionellen Einsatz

Koexistenz

Diese Liste ließe sich noch erweitern. Ein wichtiger Punkt für die Entscheidung einer Firma wird sicherlich auch die Frage der Nachhaltigkeit und Langlebigkeit von Hadoop sein. Relationale Datenbanken sind fest etabliert und viele Firmen besitzen ausreichend Know-how, um ihre Bedürfnisse ausreichend abbilden zu können. Zu erwarten ist daher eine Koexistenz, bei der sich die beiden Ansätze gegenseitig ergänzen.

Fazit

Aus der ursprünglichen Idee von Google, die Komplexität einer verteilten Anwendung zu reduzieren, hat sich mit Apache Hadoop ein reichhaltiges Ökosystem an vielfältigen Werkzeugen zur Datenverarbeitung entwickelt. Insbesondere wegen seiner hervorragenden Skalierungseigenschaften, eingebauter Fehlertoleranz und vieler Automatismen erweist sich Apache Hadoop bei der Arbeit in zahlreichen Unternehmen und Forschungsgruppen als essenziell.

Das bedeutet keinesfalls, dass klassische Datenverarbeitungssysteme wie relationale Datenbanken überflüssig werden. Wenn es aber darum geht, das ständig wachsende digitalisierte Wissen der Welt zu verarbeiten, werden skalierende Systeme wie Hadoop in Zukunft weiter an Bedeutung gewinnen. (mhu)

Infos

  1. Paul Yang, "Moving an Elephant: Large Scale Hadoop Data Migration at Facebook": https://www.facebook.com/10150246275318920
  2. Dean, J., Ghemawat, S., "MapReduce: Simplified Data Processing on Large Clusters": In Operating Systems Design and Implementation (OSDI), 2004, S. 137-150
  3. Apache Hadoop: http://hadoop.apache.org
  4. Ghemawat, S., Gobioff, H., Leung, S.T.: "The Google File System": In Scott, M.L., Peterson, L.L., eds.: Symposium on Operating Systems Principles (SOSP), ACM (2003), S. 29-43
  5. Pig: http://pig.apache.org
  6. Hive: http://hive.apache.org
  7. Hbase: http://hbase.apache.org
  8. CDH von Cloudera: http://www.cloudera.com
  9. White, T., "Hadoop – The Definitive Guide": 2edn., O'Reilly, 2011

Der Autor

Dr.-Ing. Thomas Hornung, Martin Przyjaciel-Zablocki und Alexander Schätzle sind wissenschaftliche Mitarbeiter am Institut für Informatik der Universität Freiburg. Sie forschen an der parallelisierten Verarbeitung semantischer Daten.

Diesen Artikel als PDF kaufen

Express-Kauf als PDF

Umfang: 5 Heftseiten

Preis € 0,99
(inkl. 19% MwSt.)

Als digitales Abo

Als PDF im Abo bestellen

comments powered by Disqus

Ausgabe 07/2013

Preis € 6,40

Insecurity Bulletin

Insecurity Bulletin

Im Insecurity Bulletin widmet sich Mark Vogelsberger aktuellen Sicherheitslücken sowie Hintergründen und Security-Grundlagen. mehr...

Linux-Magazin auf Facebook