Der neu implementierte Parser basiert auf der HTML-5-Spezifikation der WHATWG, einer Arbeitsgruppe von Browserherstellern. Damit soll die Bibliothek Web-Inhalte genauso verarbeiten wie die Browser Chrome, Firefox oder Safari.

Außerdem haben die Entwickler die Verarbeitungsgeschwindigkeit gesteigert und den Speicherverbrauch reduziert. Daneben gibt es neue Methoden, um DOM-Knoten zu verschieben oder neue einzufügen sowie Methoden, um den Inhalt von Elementen auszupacken (etwa um unerwünschte Formatierungen zu entfernen).

Weitere Informationen finden sich auf der Jsoup-Homepage. Dort steht Version 1.6.0 auch als Jar-Archiv sowie im Quelltext unter MIT-Lizenz zum Download bereit.