KI-Programmierer: Githubs Copilot erzeugt fehlerhaften Code

- 27. August 2021

Der vor kurzem gestarteten Versuch der Versionsverwaltungsplattform Github, Entwicklern mit Copilot eine künstliche Intelligenz zur Seite zu stellen, die Code erzeugt, ist aus Sicht eines Forscherteams stark fehlerbehaftet.

Copilot ist ein Sprachmodell, das anhand von Open-Source-Code von Github trainiert wurde. Copilot beziehe dann Kontext aus dem vom Entwickler geschriebenen Code und schlage ganze Zeilen oder auch Funktionen vor, hatte Github-CEO Nat Friedman zur Einführung des Tools geschrieben.

Ein Forscherteam der Cornell Universty hat sich dem Copiloten nun mit empirischen Versuchen zur Sicherheit des produzierten Codes genähert und hat herausgefunden, dass der Code oft Fehler enthält. Angesichts der riesigen Menge an ungeprüften Codes, die Copilot verarbeitet habe, sei es sicher, dass das Sprachmodell aus angreifbarem, fehlerhaftem Code gelernt habe. Das werfe Bedenken hinsichtlich der Sicherheit der Codebeiträge von Copilot auf, schreiben die Forscher. In ihrer Arbeit haben sie die Bedingungen untersucht, die Github Copilot dazu veranlassen könnte, unsicheren Code zu empfehlen.

Um ihre Analyse durchzuführen, ließen sie Copilot Code in Szenarien generieren, die für hochriskante Common Weakness Enumerations (CWE) relevant sind. Dazu zählen die Forscher etwa solche aus der “Top 25”-Liste von MITRE. Untersucht haben sie den Output von Copilot auf drei verschiedenen Achsen der Codegenerierung, schreiben die Forscher. Dabei wurde berücksichtigt, wie Copilot bei unterschiedlichen Schwachstellen, unterschiedlichen Aufforderungen und unterschiedlichen Domänen abschneidet. Insgesamt seien 89 verschiedene Szenarien für Copilot erstellt worden, aus denen 1692 Programme hervorgingen, teilen die Forscher mit. Von diesen Programmen hätten sich etwa 40 Prozent als anfällig erwiesen.

SCHLAGWORTE
Code
Github
KI
Security

Linux-Kommandozeilentools kommen für Windows

Mit den "Coreutils for Windows" stellt Microsoft ein Set von Kommandozeilenwerkzeugen - dieselben wie unter Linux, MacOS oder WSL - bereit, das nativ unter Windows ausgeführt werden kann.

KI-Modelle lernen mit Open-Source-Daten Diagramme zu lesen

Das neue Trainingsdatenset ChartNet, entworfern von Forschern des MIT und des MIT-IBM Computing Research Lab, könnte die Genauigkeit von Vision-Language-Modellen (VLM) verbessern, die bei der Analyse von Geschäftstrends oder der Interpretation wissenschaftlicher Abbildungen helfen.

Trump unterzeichnet Anordnung zur Überprüfung von KI-Modellen

Die Anordnung stellt eine Abkehr von der bisher vom Weißen Haus gegenüber KI verfolgten zurückhaltenden Haltung dar. Sie folgt auf Debatten darüber, wie man die Kontrolle über KI-Modelle erlangen könne, ohne dabei die Innovation zu behindern.

Vim Classic in erster Version erschienen

Vim Classic ist einer von zwei Vim-Forks (der andere ist EVi), die sich auf die Fahnen geschrieben haben, ganz ohne KI-Unterstützung entwickelt zu werden. Vim Classic geht auf Vim 8.2.0148 zurück (EVi dagegen auf Vim 9.10 mit dem neuen Vim9-Script-Feature) und ist nun in der ersten Version 8.3...

Flathub verbietet KI-generierte Inhalte aller Art

Flathub, das zentrale Repository für Flatpak-Apps, hat eine neue Policy eingeführt, der zufolge KI-generierte oder -assistierte Inhalte verboten sind.

Anthropic beantragt Börsengang

Anthropic, das KI-Unternehmen hinter dem Chatbot Claude, hat vertraulich einen Antrag auf einen Börsengang eingereicht.

E-Mail Benachrichtigung

0 Kommentare

Älteste

Neuste Beste Bewertung

Inline Feedbacks

Alle Kommentare anzeigen