Auf der Big-Data-Konferenz Strata + Hadoop World hat HP die Open-Source-Software „HP Haven Predictive Analytics“ vorgestellt, die großvolumiges maschinelles Lernen und statistische Analysen großer Datenmengen beschleunigt. Dabei kommt unter andrem die HP-Labs-Entwicklung Distributed R zum Einsatz. Sie erlaubt die Analyse viel größerer Datensätze als dies bisher mit der populären Programmiersprache R möglich war.
Die neue Lösung ist jetzt http://www.vertica.com/distributedr verfügbar und umfasst unter anderem die folgenden Komponenten und Funktionen:
- Distributed R – eine von den HP Labs entwickelte neue Hochleistungs-Maschine auf der Grundlage der Open-Source-Sprache R für anspruchsvollste Predictive-Analytics-Aufgaben.
- Datenbeschleunigung und SQL-Unterstützung mit HP Vertica – die native Integration mit der spaltenorientierten Vertica-Datenbank für Massively Parallel Processing (MPP) erhöht die Datenzugriffsgeschwindigkeit um bis zu fünf Mal.
- Vorgefertigte Algorithmen – ein umfangreicher Satz an erprobten parallelen Algorithmen, die zuverlässige und konsistente Ergebnisse mit ausgereiften Standard-R-Algorithmen erzeugen.
- Open Source – das neue Angebot ist kostenlos und vollständig kompatibel mit der Open-Source-Sprache R und ihren Werkzeugen. HP bietet Enterprise Support für die neue Lösung, der pro Knoten abgerechnet wird.
Die Open-Source-Sprache R wird von Millionen von Daten-Analysten weltweit genutzt, um Daten zu interpretieren und zu visualisieren. Allerdings bot R bislang nur limitierte Möglichkeiten, wenn es um die Verarbeitung großer Datenmengen ging. Um diese Beschränkungen zu überwinden, haben HP Labs und HP Software Distributed R entwickelt. Durch die Verteilung der Aufgaben auf mehrere Rechnerknoten wird die Verarbeitungsgeschwindigkeit erhöht. Das Resultat dieser Initiative ist die erste Open-Source-Version einer verteilten Plattform für R, die speziell für Predictive Analytics auf der Grundlage von Big Data entwickelt wurde.



