
Open-Source-Software hilft bei der Cluster-Analyse über die Autoren der Bibel. (Quelle: Plosone.org)
Die Open-Source-Software Author-detection will Plagiatsjägern helfen, festzustellen, ob ein Text ein Original ist oder nicht. Entwickelt hat das ein Team von Wissenschaftlern an der Universität Adelaide, und die Software kann noch viel mehr. Vielleicht müssen sogar Teile der Bibelgeschichte neu geschrieben werden.
Zumindest legen das Ergebnisse von Wissenschaftlern aus Australien nahe: Als die ihre Urheber-Erkennungs-Software namens Author-Detection auf die Bibel losließen, lieferte die Open-Source-Software Anlass für Zweifel an der Authentizität der Urheberschaft, etwa in diversen Briefen des Apostel Paulus. “Irgendein anderer Autor scheint seine Hände da drin gehabt zu haben”, zitiert The Register Professor Derek Abbott von der Uni Adelaide. Zur Beruhigung: Zwar gebe es handfeste Indizien, aber hundertprozentig nachgewiesen sei das noch nicht.

Open-Source-Software hilft bei der Cluster-Analyse über die Autoren der Bibel. (Quelle: Plosone.org)
Für die Analyse mit der in Github veröffentlichten Software haben die Wissenschaftler zahlreiche historische Texte getestet und dabei einige Überraschungen erlebt. Author-Detection vergleicht Texte, die scheinbar vom gleichen Autor stammen und berichtet über Textstellen, die statistisch so gar nicht in den Kontext oder zu den sonstigen Schreibgewohnheiten des Autors passen.
Aufklärung nicht nur bei Plagiaten
Anwendungsgebiete für die Software sehen die Entwickler nicht nur bei der Jagd nach Plagiaten, sondern auch in der Spam-Detection, DNA-Analyse, aber auch der Aufklärung anonymer (Droh-)Briefe oder ähnlichen (Cyber-)Crimes. Wer sich für wissenschaftliche Hintergründe und Details interessiert, findet hier die Studie der Wissenschaftler in voller Länge. Author-Detection nutzt statistische Merkmale, um Autoren Texte und Textstellen zuzuordnen, ist in C++ programmiert und steht unter GPL. Den Entwicklern zufolge setzt sie massiv Techniken des Data-Mining, Maschinenlernens und der künstlichen Intelligenz ein, um die großen Datensätze zu beackern.




