Fehlender Quellcode erschwert KI-Forschung

- 20. Februar 2018

Die Webseite Sciencemag.org berichtet über die Schwierigkeit, Forschungen zu künstlicher Intelligenz zu überprüfen. Häufig halten die Forscher die dafür nötigen Algorithmen und Daten zurück.

Hintergrund des Artikels ist, dass sich die Association for the Advancement of Artificial Intelligence (AAAI) getroffen hat, um über die Reproduzierbarkeit von Forschungsergebnissen im KI-Bereich zu reden. Demnach hat auch die KI-Forschung ein Problem, dass Linux-Nutzern bekannt vorkommen dürfte: Der Quellcode fehlt.

Kein Code

Das Grundproblem scheint zu sein, dass Forscher zwar Ergebnisse vorstellen, aber ihre Daten nicht teilen. So hat der Informatiker Odd Erik Gundersen von der Universität Trondheim in Norwegen 400 Algorithmen untersucht, die in wissenschaftlichen Veröffentlichungen auf wichtigen KI-Konferenzen vorgestellt wurden. Lediglich sechs Prozent der Forscher hätten auch den nötigen Quellcode publiziert, nur ein Drittel die Daten veröffentlicht, mit denen der Algorithmus getestet wurde und nur die Hälfte hat Pseudocode publiziert, der den verwendeten Algorithmus grob zusammenfasst.

Die Gründe für den fehlenden Code seien vielfältig und reichen vom Work-in-Progress über Firmenrechte bis hin zu egoistischen Motiven der Forscher und zu verlorenem Code. Selbst mit dem Code sei es aber schwierig, Ergebnisse nachzuvollziehen. Das Training verlaufe sehr individuell, die Daten beeinflussen naturgemäß die Algorithmen und darüber die Gewichtungen in den Netzen. Mehrere Trainingsläufe führen also zu unterschiedlichen Ergebnissen.

Experimente besser standardisieren

Peter Henderson von der McGill-Universität in Montreal rief daher dazu auf, bessere experimentelle Prozeduren und Evaluationsmethoden zu entwickeln. Er hat das vom Open-AI-Projekt entwickelte Gym verwendet, mit dem es möglich sei, die Experimente mit AI zu standardisieren. Ein anderes beim AAAI-Meeting vorgestelltes Tool von IBM ist ein neurales Netzwerk, das andere neurale Netzwerke auf Basis von Charts und Diagrammen mit Hilfe von Open-Source-Code nachbaut. Nicht zuletzt soll die Webseite Openml.org nicht nur Algorithmen anbieten, sondern auch die dazugehörigen Daten sowie Informationen zu den Durchläufen bei den Experimenten.

Weltklassemodell aus China vorgestellt

Das chinesische Start-up Moonshot hat mit Kimi K3 ein neues Modell mit 2,8 Billionen Parametern vorgestellt, das auch in unabhängigen Tests mit den besten Modellen von OpenAI oder Anthropic mithalten kann. Damit schließt das Modell die Lücke, die bisher noch zwischen den amerikanischen...

Forgejo 16.0 ist da

Die neue Version 16.0 des leichtgewichtigen Tools für Code-Hosting und -Kollaboration ist am 16. Juli 2026 erschienen.

Klarstellung: Linus Torvalds erlaubt KI bei Kernel-Entwicklung

Der Einsatz von Künstlicher Intelligenz ist bei der Kernel-Entwicklung explizit erlaubt – das Linus Torvalds im Rahmen einer Diskussion noch einmal klargestellt. Für KI-Kritiker findet er darin zudem drastische Worte.

frame: vollständig in Assembler geschriebener X-Server

Der Norweger Geir Isene hat einen X-Server komplett in Assembler geschrieben. Der soll nicht nur deutlich ressourcenschonender arbeiten als das Pendant von X.org, er besteht derzeit auch nur aus rund 20.000 Zeilen Code. Es gibt aber auch ein paar Haken.

OpenShift 4.22 bringt Updates für Sicherheit, Virtualisierung und KI

Red Hat hat die Version 4.22 seiner Plattform OpenShift veröffentlicht. Das Update bringt Neuerungen für die Sicherheit, die Verwaltung virtueller Maschinen, die Automatisierung von Cloud-Infrastrukturen und den Betrieb von Anwendungen mit Künstlicher Intelligenz.

FrOSCon 2026: Programm steht fest

Die diesjährige FrOSCon findet am 15. und 16. August statt.

Die Free and Open Source Software Conference findet am 15. und 16. August 2026 an der Hochschule Bonn-Rhein-Sieg in Sankt Augustin statt. Der Eintritt ist frei.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung