Nachdem das KI-basierte Chattool ChatGPT derzeit einen Höhenflug erlebt, was Nutzung und mediales Interesse anbelangt, hat Anbieter OpenAI damit begonnen, ein neues Tool zu trainieren, das Texte erkennt, die mit Hilfe von künstlicher Intelligenz verfasst sind.
Der AI-Classifier von OpenAI soll zwischen von Menschen geschriebenen Texten und von KI verfassten Texten verschiedener Anbieter unterscheiden können. Auch wenn es unmöglich sei, alle von KI geschriebenen Texte zuverlässig zu erkennen, könnten gute Klassifikatoren Informationen für falsche Behauptungen liefern, dass KI-generierter Text von einem Menschen geschrieben wurden. Zu diesen Fällen zählt OIpenAI in einem Blogbeitrag etwa automatisierte Fehlinformationskampagnen, die Verwendung von KI-Tools für Betrügerein bei akademischen Arbeiten und die Positionierung eines KI-Chatbots als Mensch.
Der Klassifikator arbeite derzeit aber noch nicht zuverlässig, raumt OpenAI ein. Bei der Auswertung eines “Challenge Set” englischer Texte habe er 26 Prozent der von KI geschriebenen Texte korrekt als “wahrscheinlich von KI geschrieben”, während er von Menschen geschriebene Texte in 9 Prozent der Fälle fälschlicherweise als von KI geschrieben eingestuft habe (false positiv). Die Zuverlässigkeit des AI-Classifier verbessere sich in der Regel mit zunehmender Länge des Eingabetextes. Im Vergleich zu einem zuvor veröffentlichten Klassifikator sei der neue bei Texten von neueren KI-Systemen deutlich zuverlässiger.
Der Klassifikator steht öffentlich zur Verfügung. OpenAI erwartet sich Feedback darüber, ob Werkzeuge wie dieses nützlich sind, auch wenn sie nicht gänzlich zuverlässig arbeiten. Die Arbeit an der Erkennung von KI-generiertem Text werde fortgesetzt. Der kostenlos nutzbare Work-in-Progress-Klassifikator lässt sich hier ausprobieren.



