OpenDevin ermöglicht die Entwicklung von KI-Agenten, die mit anderen Anwendungen über Software-Schnittstellen interagieren. Die Plattform bietet eine flexible Architektur, einen Sandbox-Modus und Tools zur Evaluation.
Forscher mehrerer Institutionen haben OpenDevin vorgestellt, eine Open-Source-Plattform für die Entwicklung von KI-Agenten. Die Plattform ermöglicht es Agenten, über Software-Schnittstellen mit ihrer Umgebung zu interagieren, ähnlich wie menschliche Entwickler. Der Name ist vermutlich an das kommerzielle KI-Programmierwerkzeug "Devin" angelehnt.
OpenDevin besteht aus drei Hauptkomponenten: einer Agenten-Abstraktion, einem Event-Stream zur Verfolgung von Aktionen und Beobachtungen sowie einer Laufzeitumgebung zur Ausführung von Agenten-Aktionen.
Die Plattform bietet eine sichere Sandbox-Umgebung, in der Agenten Code ausführen und auf eine Bash-Shell, einen Jupyter-Notebook-Server sowie einen Webbrowser zugreifen können. Dies ermöglicht es den Agenten, komplexe Software-Entwicklungsaufgaben und webbasierte Aufgaben zu bewältigen.
OpenDevin enthält bereits mehrere implementierte Agenten, darunter einen generalistischen CodeAct-Agenten und einen spezialisierten Web-Browsing-Agenten. In ersten Benchmarks zeigen die OpenDevin-Agenten konkurrenzfähige Leistungen in verschiedenen Aufgabenbereichen. Zudem können Nutzer leicht eigene "Micro Agents" für spezifische Aufgaben erstellen.
Die Plattform unterstützt auch die Zusammenarbeit mehrerer Agenten. So kann etwa ein generalistischer Agent Aufgaben an spezialisierte Agenten delegieren. Die Interaktion mit den Nutzern erfolgt über eine chatbasierte Benutzeroberfläche, die die aktuellen Aktionen des Agenten visualisiert und Echtzeit-Feedback erlaubt.
Eine Besonderheit von OpenDevin ist die AgentSkills-Bibliothek. Sie enthält häufig verwendete Funktionen wie Datei-Editierung oder das Auslesen von Bildern mithilfe von Vision-Language-Modellen. Die Bibliothek lässt sich um neue Fähigkeiten erweitern.
Die Entwickler konzipierten OpenDevin als Community-Projekt. Der Quellcode ist unter der MIT-Lizenz bei Ghitub veröffentlicht, was auch eine kommerzielle Nutzung erlaubt. Für die Zukunft plant das Team Verbesserungen wie eine erweiterte Unterstützung für Multimodalität, leistungsfähigere Agenten und eine stabilere Laufzeitumgebung.
Agenten als neuer Entwicklungshorizont für KI-Systeme
Langfristig soll OpenDevin die Entwicklung sicherer und nützlicher KI-Agenten vorantreiben. Führende KI-Unternehmen wie OpenAI glauben, dass KI-Agenten - also handelnde, miteinander agierende KI-Programme - der übernächste Schritt in der KI-Entwicklung sein werden. Zuvor kommen KI-Modelle mit Logikfähigkeiten.
Generell haben die existierenden Agentenansätze noch viel Luft nach oben, wie auch die OpenDevin-Benchmarks zeigen. Microsofts KI-CEO prognostizierte kürzlich, dass es noch zwei Generationen KI-Modelle benötige, bis verlässliche KI-Agenten möglich seien.