Mit den Utilities möchten Sebastiano Vigna und seine Kollegen Java befähigen, sehr große Graphen und Dokumentensammlungen aus Web-Crawls zu verarbeiten. Wie Vigna in einer kleinen Broschüre (PDF-Dokument) schreibt, führen sie dazu unter anderem den Datentyp 64-Bit-Long ein.

Zum Softwarepaket gehört Fastutils, das Maps, Sets, Listen und Queues für umfangreichen Daten bereitstellt. Die Komponente Sux4J ermöglicht Rank-/Select-Queries für bis zu 2^64 Bit, MG4J (Managing Gigabytes for Java) ist eine Volltextsuchmaschine für große Dokumentensammlungen, und WebGraph dient zum Komprimieren großer Graphen.

Mit den DSI-Utilities 2.0 erfahren die Softwarekomponenten ein synchronisiertes Release. Alle Bibliotheken erfordern nun Java 6. Weitere Informationen, Javadoc, Quelltext und Binärpakete gibt es auf der Projekt-Homepage. Die Komponenten stehen unter freien Lizenzen wie LGPLv3 und der Apache License 2.0.