Google Brain: Neues Paper zu KI und Textzusammenfassungen

Das Deep-Learning-Projekt Google Brain will mit KI-Software aus mehreren Dokumenten automatisch Wikipedia-Artikel generieren. Ein neues Paper zeigt den Stand der Dinge.

Bislang existierende Ansätze haben sich vor allem auf Zusammenfassungen von einer Seite Text konzentriert. Der neue Ansatz des Google-Brain-Teams besteht in der “Multi-Document Summarization”, also einer Zusammenfassung von Texten aus mehreren Dokumenten. Auf diese Weise ließen sich irgendwann etwa Wikipedia-Artikel aus verschiedenen vorliegenden Quellen automatisch generieren.

Das bei Arxiv.org veröffentlichte Paper [PDF] zeigt nun die vom Google-Team verwendeten Ansätze. Während frühere Ansätze vorhandene Sätze aus den Quelldokumenten benutzten, um die Zusammenfassung zu generieren, versucht sich das Google-Brain-Team an neu erzeugten Sätzen. Im Paper wird zunächst versucht, nach dem Vorbild der englischsprachigen Wikipedia Einleitungssätze zu formulieren. Am Ende wird ein kompletter Artikel erzeugt. Dabei verwendet der Google-Ansatz eine nicht-rekursive Transformer-Architektur, die nur auf einen Decoder, nicht aber auf einen Encoder setzt.

Material

Details zu den Experimenten finden sich in dem Paper. Das Datenset und den dazugehörigen Code veröffentlicht das Projekt auf Github, also Software kam unter anderem Tensor2Tensor zum Einsatz.

E-Mail Benachrichtigung
Benachrichtige mich zu:
0 Kommentare
Älteste
Neuste Beste Bewertung
Inline Feedbacks
Alle Kommentare anzeigen
Jörg Linuxfreund
8 Jahre her

Na hoffentlich ist am Ende noch ein Mensch da der das Ergebnis überprüft.

Nach oben