Inhalt
summary Zusammenfassung

Ein Experiment mit Claude 3.5 demonstriert, wie ein simpler Prompt den Code nicht nur hundertfach schneller macht, sondern auch unerwartete Enterprise-Features hinzufügt.

Anzeige

Ein ungewöhnliches Experiment des Buzzfeed Senior Data Scientists Max Woolf zeigt, wie der KI-Chatbot Claude 3.5 auf wiederholte Aufforderungen reagiert, denselben Code zu verbessern.

Woolf gab dem System zunächst eine klassische Programmieraufgabe: Ein Python-Programm sollte in einer Million Zufallszahlen zwischen 1 und 100.000 die Differenz zwischen der kleinsten und größten Zahl mit einer Ziffernsumme von 30 berechnen.

Nach der ersten Lösung forderte Woolf das System wiederholt mit dem simplen Prompt "write better code" auf, den Code zu optimieren. Das Ergebnis: Die Ausführungszeit verbesserte sich von ursprünglich 657 Millisekunden auf nur noch 6 Millisekunden - eine Beschleunigung um den Faktor 100.

Anzeige
Anzeige

KI fügt ungefragt Enterprise-Features hinzu

Die eigentliche Überraschung kam mit der letzten Iteration: Claude 3.5 verwandelte den Code ungefragt in eine Enterprise-Anwendung und fügte eigenständig typische Unternehmensfeatures hinzu. Offenbar existiert im System eine Verknüpfung zwischen "Enterprise" und "besserem Code".

In einem zweiten Versuch mit präziseren Prompts erreichte Woolf schneller bessere Ergebnisse, stieß dabei aber auf subtile Bugs, die manuelle Korrekturen erforderten. Interessanterweise schlug die KI offensichtliche Optimierungen wie das Entfernen von Duplikaten oder das Sortieren der Zahlen nicht vor - Ansätze, die menschlichen Entwicklern laut Woolf vermutlich als Erstes eingefallen wären.

Zwei Balkendiagramme vergleichen Code-Speedups über 4 Iterationen: Links casual use mit moderaten Verbesserungen, rechts prompt engineering mit höheren aber fehlerhaften Werten.
Während einfache Nachfragen die Codequalität zunächst nur minimal verbessern, führt gezieltes Prompt Engineering sofort zu deutlichen Leistungssteigerungen - allerdings mit höherem Fehlerrisiko. | Bild: Max Woolf

Der KI-Entwickler Simon Willison liefert eine Erklärung für das Phänomen der iterativen Verbesserung: KI-Sprachmodelle sind im Grunde "gedächtnislos" - jede Anfrage wird als komplett neues Problem behandelt. Bei der Aufforderung "besseren Code zu schreiben" erhält das System den kompletten vorherigen Gesprächsverlauf als Kontext und analysiert ihn wie fremden Code.

Das erkläre auch, warum die Verbesserungen mit jeder Iteration weitergehen: Die KI betrachtet den Code jedes Mal neu und unvoreingenommen - wie ein externer Entwickler, der frisch auf das Problem schaut.

Prompt-Engineering wird 2025 noch wichtiger

Woolf betont, dass sich der Aufwand für präzises Prompt-Engineering auszahlt. Schon kleine Anpassungen in der Formulierung der Anfragen können die Qualität der Ergebnisse deutlich verbessern.

Empfehlung

Besonders Claude 3.5 reagiere hervorragend auf detaillierte Prompts. Laut Woolf wird Prompt Engineering auch 2025 daher nicht überflüssig - im Gegenteil: Je besser die KI-Modelle werden, desto wichtiger wird die präzise Anleitung.

Woolf warnt vor übertriebenen Erwartungen an KI-Systeme: Auch wenn die Performance-Verbesserungen beeindruckend sind, brauche es am Ende immer noch menschliche Entwickler, um die generierten Lösungen zu prüfen und Fehler zu beheben. Entgegen den Behauptungen von KI-Enthusiasten sei die Technologie kein Wundermittel für perfekten Code.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Ein Experiment mit dem KI-Chatbot Claude 3.5 zeigt, dass wiederholte Aufforderungen mit dem simplen Prompt "write better code" die Ausführungszeit eines Python-Programms um den Faktor 100 beschleunigen können.
  • Präzises Prompt-Engineering führte jedoch schneller zu signifikanten Leistungssteigerungen, hatte aber im Test auch ein höheres Fehlerrisiko.
  • Ab der vierten "Mach's besser"-Iteration fügte Claude 3.5 ungefragt Enterprise-Funktionen hinzu. Offensichtlich gibt es im System einen Zusammenhang zwischen "Enterprise" und "besserem Code".
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!