DSI-Utilities 2.0: Java-Software für große Datenmengen
Die Java-Utilities des Dipartimento di Scienze dell' Informazione (DSI) der Universität Mailand sind in Version 2.0 verfügbar.
Mit den Utilities möchten Sebastiano Vigna und seine Kollegen Java befähigen, sehr große Graphen und Dokumentensammlungen aus Web-Crawls zu verarbeiten. Wie Vigna in einer kleinen Broschüre (PDF-Dokument) schreibt, führen sie dazu unter anderem den Datentyp 64-Bit-Long ein.
Zum Softwarepaket gehört Fastutils, das Maps, Sets, Listen und Queues für umfangreichen Daten bereitstellt. Die Komponente Sux4J ermöglicht Rank-/Select-Queries für bis zu 2^64 Bit, MG4J (Managing Gigabytes for Java) ist eine Volltextsuchmaschine für große Dokumentensammlungen, und WebGraph dient zum Komprimieren großer Graphen.
Mit den DSI-Utilities 2.0 erfahren die Softwarekomponenten ein synchronisiertes Release. Alle Bibliotheken erfordern nun Java 6. Weitere Informationen, Javadoc, Quelltext und Binärpakete gibt es auf der Projekt-Homepage. Die Komponenten stehen unter freien Lizenzen wie LGPLv3 und der Apache License 2.0.





