KI wird besser im Programmieren. Der für Menschen gemachte Code-Wettbewerb Codeforces zieht daraus eine Konsequenz: KI-Beiträge sind verboten. Kontrollieren kann der Wettbewerb das aber kaum.
Die Online-Programmierplattform Codeforces hat eine neue Regel eingeführt, die den Einsatz von KI-basierten Systemen wie GPT, Gemini, Gemma, Llama und Claude zur Lösung von Programmieraufgaben in Wettbewerben einschränkt.
Laut Mike Mirzayanov, dem Gründer von Codeforces, ist dieser Schritt notwendig, da neuronale Netze in letzter Zeit bemerkenswerte Fortschritte gemacht und nun eine Qualität erreicht hätten, die nicht mehr ignoriert werden könne.
Die Entscheidung folgt auf die Veröffentlichung von OpenAIs o1 und eindrucksvollen Ergebnissen bei dem Programmierwettbewerb. In simulierten Codeforces-Wettbewerben erreichte das o1-Modell eine Elo-Wertung von 1807 und schnitt damit besser ab als 93 Prozent der menschlichen Teilnehmer. In einem Live-Wettwerber erzielte o1 fast den "Master"-Level.
Die neue Regel gilt ausschließlich für die Teilnahme an Wettbewerben und erlaubt den Einsatz von KI nur in begrenztem Umfang, wie die Übersetzung von Aufgaben oder die Verwendung von Code-Vervollständigungstools für Syntax und kleinere Codierungsvorschläge. Die Verwendung von KI zur Generierung von Kernlogik oder Algorithmen zur Lösung von Problemen ist jedoch verboten.
Die Durchsetzung des Verbots dürfte sich als Herausforderung erweisen, da Codeforces hauptsächlich auf die Integrität der Teilnehmer angewiesen ist.
Ein Nutzer kommentiert die Entscheidung kritisch und merkt an, dass es für die Teilnehmer sehr einfach sei, KI-generierten Code so zu verändern, dass er sich von anderen unterscheidet, ohne das Wesen der Lösung zu verstehen.
Er argumentiert, dass die Zukunft von Wettbewerbsprogrammierungsseiten letztlich von der Vertrauenswürdigkeit der Teilnehmer abhänge und der Kampf gegen KI-Modelle von vornherein ein verlorener Kampf sei.
Ähnlich fühlten Menschen auch in anderen Sportarten wie Schach oder Go, in denen KI mittlerweile überlegen ist. Allerdings treten hier noch immer Menschen direkt gegeneinander an. In reinen Mensch-Mensch-Duellen bleibt der Wettkampfgedanke also erhalten. In einem anonymen Online-Duell ist das schwerlich möglich.
Die Plattform plant, die Entwicklung der KI-Technologien genau zu beobachten und die Regeln bei Bedarf anzupassen, um einen Ausgleich zwischen fairem Wettbewerb und den Vorteilen des KI-gestützten Lernens zu schaffen.
o1-Code überzeugt George Hotz
Der renommierte Programmierer George Hotz sieht mit o1 großes Potenzial in der Verwendung von KI für die Programmierung.
Er meint, dass das ChatGPT o1-preview-Modell das erste ist, das überhaupt in der Lage ist, zu programmieren, und verweist auf dessen IQ-Wert von 12o im Norway Mensa Test.
Hotz ist sehr optimistisch, was den Einsatz von Reinforcement Learning in Entwicklungsumgebungen angeht, bei dem KI-Systeme Code schreiben, Tests durchführen und ihre Arbeit überprüfen.