Offener Podcast-Generator von Meta

- 28. Oktober 2024

KI erzeugt Audio-Dialoge aus Text.(C) DeshaCAM, Fotolia

Nachdem Google im September viel Aufmerksamkeit mit einer neuen Funktion seines KI-Notiz- und Rechercheassistenten NotebookLM auf sich zog, die aus einem PDF mit Neuigkeiten einen Audio-Podcast mit verteilten Sprecherrollen erzeugen kann, zog Meta nun nach und offeriert Vergleichbares in einer offenen Version.

Das Tool nennt sich in Anlehnung an das Original NotebookLlama und basiert auf einem Sprachmodell der Llama-Familie. Man kann ihm ebenfalls einen Sachbericht, einen Blog Post oder eine Nachricht in Form eines PDF vorgeben und es verwandelt die Daten in eine Podcast-Sequenz. Dabei fertigt es zunächst ein Transkript an, dass die Fakten mit dramaturgischen Mitteln in einen Dialog verwandelt und übergibt das Ergebnis dann einem Text-to-Speech-Modell, das daraus ein Audio-File erzeugt.

Metas Tool kommt noch nicht ganz an die Qualität des Originals von Google heran – die Stimmen klingen noch roboterhafter und sie fallen sich manchmal auch an unpassenden Stellen ins Wort – aber diese Nachteile, meinen Forscher bei Meta, ließen sich mit besseren Sprachmodellen beheben. Außerdem könne zukünftig man statt eines einzelnen Modells, wie es derzeit benutzt wird, auch mit zwei Modellen arbeiten, die miteinander debattieren und so den Podcast-Entwurf erzeugen.

Chinesisches Spitzenmodell braucht keine GPUs und wird Open Source

Auf OpenRouter, einer Plattform, die über eine einheitliche API Zugriff auf Dutzende Sprachmodelle erlaubt, rangierte in den letzten Wochen das anonyme Modell Owl Alpha in den Nutzungsstatistiken auf vorderen Plätzen. Jetzt wurde bekannt, das dahinter das Modell LongCat-2.0 des chinesischen...

Mageia 10 mit Linux-Kernel 6.18 und aktueller Desktop-Software

Die Mageia-Gemeinschaft hat Version 10 ihrer Linux-Distribution veröffentlicht. Rund drei Jahre nach dem Erscheinen der Version 9 des Mandriva-Nachfolgers.

Google Meet protokolliert in Meetings mit

Google Nutzer mit KI Pro- und Ultra-Abos brauchen in Meetings ab sofort keinen Schriftführer mehr: Google Meet transkribiert die Diskussion selbstständig und fasst die wichtigsten Maßnahmen per E-Mail und in einem Google-Doc-File zusammen, dass den Teilnehmern anschließend automatisch zugestellt...

Universität Paderborn erweitert Supercomputer „Otus“

Die Universität Paderborn baut ihren Hochleistungsrechner „Otus“ aus. Wie die Hochschule mitteilt, stehen dafür mehr als zwölf Millionen Euro aus Landes- und Bundesmitteln zur Verfügung.

Linux Foundation gründet Initiative zur Schwachstellensuche in Open-Source-Software

Die Linux Foundation hat zusammen mit Industriepartnern wie Amazon Web Services, Anthropic, Cisco, Ericsson, Google, IBM, JPMorganChase, Microsoft, GitHub, NVIDIA, OpenAI, Red Hat oder der Rust Foundation die Initiative Akrites gegründet, die Open-Source-Software vor der Bedrohung durch...