Open Source im professionellen Einsatz

Apache Spark 2.0.0 – Major-Update mit verbesserten APIs

27.07.2016

Apache hat die Version 2.0 des Frameworks für verteilte Berechnungen über Cluster hinweg veröffentlicht.

96

Spark 2.0.0 bringt laut der Ankündigung des Projekts eine Reihe in der Usability und Leistungsfähigkeit verbesserte APIs mit. Das Projekt garantiert zudem die Stabilität der APIs, sofern sie nicht als experimentell gekennzeichnet sind. Zu den von den Entwicklern optimierten APIs zählen das nun leistungsfähigere Accumulator API. Neu ist ein Konfigurations-API für SparkSession.

Zu den weiteren Verbesserungen der Version 2 zählt der SQL-Support. Spark SQL können nun alle 99 TPC-Queries abfragen. Ein antiver SQL-Parser komme mit ANSI-SQL und Hive QL zurecht. Leistungsverbesserungen gibt es auch für Operatoren in SQL und Dataframes.

Ähnliche Artikel

comments powered by Disqus

Stellenmarkt

Artikelserien und interessante Workshops aus dem Magazin können Sie hier als Bundle erwerben.