Lucene und Solr 4.0 bringen Tempo und Cluster
Die Java-Suchmaschinenbibliothek Apache Lucene sowie der darauf beruhende Suchserver Solr sind in Version 4.0 mit vielen Verbesserungen verfügbar.
Die neue Lucene-Release bringt deutlich gesteigerte Performance. Wie der Entwickler Mike McCandless in seinem Blog schreibt, kann die Software den Inhalt der englischsprachigen Wikipedia nun zwei- bis drei Mal schneller indizieren. Das liegt daran, dass der Indexer zum Schreiben der Daten auf die Festplatte nun keine Pause mehr einlegt, sondern das nebenher erledigt, was sich Concurrent Flushing nennt.
Der Abfragetyp "FuzzyQuery" hat ebenfalls an Tempo zugelegt und läuft nach Angaben der Macher mehr als hundert Mal so schnell wie in früheren Versionen. Daneben können Entwickler das Index-Format nun über ein Art Plugin-Architektur um eigene Formate erweitern. Dazu gesellen sich neue Statistiken für den Index. Das Changelog enthält noch einige weitere Neuerungen. Lucene steht unter Apache License 2.0 in Quelltext- und Binärform auf der Projekthomepage zum Herunterladen bereit.
Bei Solr steht die größte Weiterentwicklung unter dem Titel "SolrCloud" und ermöglicht es, ein verteiltes HA-Cluster von Solr-Servern aufzubauen. Daneben gibt es mehr NoSQL-Features für Anwender, die Solr als primäres Storage verwenden. Dazu gehören ein Transaktionslog gegen Datenverlust, Dokumentenabruf in Echtzeit, optimistisches Locking und atomare Updates. Das Changelog listet weitere Einzelheiten. Solr 4.0 ist unter Apache License 2.0 lizenziert und steht im Quelltext und in Jar-Archiven zum Download bereit.





