Das KI-Start-up Mechanize aus San Francisco verfolgt ein radikales Ziel: die möglichst schnelle vollständige Ersetzung menschlicher Arbeit in Büroberufen. Zu diesem Zweck entwickelt das Team simulierte Arbeitsumgebungen.
"Unser Ziel ist es, Arbeit vollständig zu automatisieren", sagt Tamay Besiroglu, Mitgründer des kalifornischen Start-ups Mechanize. Gemeinsam mit Ege Erdil und Matthew Barnett – alle drei zuvor bei der KI-Forschungsorganisation Epoch AI tätig – will das Unternehmen eine vollautomatisierte Ökonomie aufbauen.
Mechanize unterscheidet sich von vielen anderen KI-Unternehmen dadurch, dass es offen kommuniziert, was viele nur andeuten. Die Ersetzung menschlicher Arbeitskraft am Computer ist dabei Programm und kein Nebeneffekt. Der erste Zielbereich ist die Softwareentwicklung.
Virtuelle Arbeitsplätze für KI-Agenten
Dabei werden KI-Modelle in simulierten Arbeitsumgebungen trainiert, die reale Arbeitsplätze nachbilden sollen. Ein Beispiel ist der Arbeitsplatz eines Softwareentwicklers mit E-Mail-Postfach, Slack-Account, Entwicklungsumgebung und Browser. Die KI erhält eine Aufgabe, wird bei Erfolg belohnt und bei Misserfolg bestraft und versucht es anschließend erneut. "Es ist im Grunde wie ein sehr langweiliges Videospiel", sagt Besiroglu in einem Interview mit der New York Times.
Die Gründer gehen davon aus, dass solche Trainingsumgebungen langfristig ausreichen, um KI-Agenten zu entwickeln, die jede Aufgabe übernehmen können, die ein Mensch am Computer erledigt. Derzeit sei das aber noch Zukunftsmusik. Barnett schätzt den Zeithorizont auf zehn bis zwanzig Jahre, Besiroglu und Erdil rechnen mit zwanzig bis dreißig Jahren.
Automatisierung ohne Umverteilungsplan
Trotz der langfristigen Perspektive ist das Ziel klar: KI-Agenten sollen alle Aufgaben in einer digitalen Arbeitsumgebung übernehmen – von der Planung über die Kommunikation bis zur Ausführung. "Erst wenn KI nahezu jede Verantwortung übernehmen kann, die ein Mensch am Computer ausführt, werden wir erfolgreich sein", schreibt das Unternehmen.
Auf gesellschaftliche Fragen reagiert Mechanize eher ausweichend. Zwar glaubt man an eine Zukunft mit "radikaler Fülle", in der ein bedingungsloses Grundeinkommen entlassene Arbeitskräfte absichert. Konkrete Vorschläge zur Gestaltung des Übergangs fehlen jedoch.
Barnett sieht das Ziel als ethisch vertretbar an: Wenn die Gesellschaft insgesamt wohlhabender wird, überwiegen die positiven Folgen die negativen Folgen der Arbeitsplatzverluste.
Die "bittere Lektion": Reinforcement Learning als zentrales Werkzeug
In einem begleitenden Essay verweisen die Gründer von Mechanize auf einen grundlegenden Widerspruch: Trotz erheblicher Fortschritte gelingt es KI-Systemen bislang nicht, menschliche Softwareingenieure vollständig zu ersetzen – selbst wenn sie auf Teilaufgaben wie das Lösen spezifischer Programmierprobleme bereits oft besser abschneiden. Aktuelle Modelle konsumieren enorme Mengen an Daten und Rechenleistung, lassen aber dennoch zentrale Fähigkeiten vermissen, die für echte Autonomie erforderlich wären.
Mechanize ordnet diese Beobachtung in die "bitter lesson" der KI-Forschung ein: Über Jahrzehnte hinweg wurden handgefertigte, auf menschlicher Intuition basierende Algorithmen immer wieder von daten- und rechenintensiven Ansätzen abgelöst, sobald diese skaliert und konsequent eingesetzt werden konnten. Der Durchbruch zur echten Automatisierung wird demnach nicht durch cleveres Design, sondern durch massives Training in reichhaltigen, realitätsnahen Simulationsumgebungen erreicht.
Dieser Ansatz steht im engen Einklang mit den neuesten Überlegungen von Sutton. Zusammen mit David Silver hat er kürzlich eine Vision für den nächsten Sprung in der KI skizziert: Agenten, die durch eigenes Handeln lernen, statt nur menschlich verfasste Daten zu konsumieren. Sie argumentieren, dass echter KI-Fortschritt davon abhängt, dass Agenten in einem kontinuierlichen Strom von Erfahrungen leben und durch Feedback und Anpassung lernen.
Von der Codehilfe zur Generalisten-KI
Mechanize sieht in der Kombination zweier Ansätze einen möglichen Weg: Zunächst erfolgt das Training auf menschlichen Beispieldaten, anschließend Reinforcement Learning in simulierten Arbeitsumgebungen. Nur so lassen sich Modelle erzeugen, die sich wie menschliche Kollegen verhalten, indem sie Code schreiben, dabei aber auch den Kontext verstehen, Aufgaben teilen, planen und Fehler korrigieren.
Dabei geht es nicht um die Automatisierung einzelner Aufgaben, sondern um die Fähigkeit, die gesamte Arbeitsrolle eines Softwareentwicklers auszufüllen. Das Ziel ist ein "Drop-in Remote Worker", der vollständig in digitale Teams eingebunden werden kann.
Derzeit bestehende RL-Umgebungen seien jedoch zu eingeschränkt: Es gibt keinen Internetzugang, die Multi-Agenten-Koordination fehlt und die Softwaretools sind rudimentär. All das verhindere, dass KI-Systeme die nötige Generalisierungsfähigkeit entwickeln.
Mechanize will diese Lücke schließen, indem das Team realistischere Trainingsumgebungen entwickelt, die der tatsächlichen Arbeitsrealität ähnlicher sind. Das Kerngeschäft von Mechanize ist also die Entwicklung einer RL-Trainingsumgebung.
Damit tritt es in Konkurrenz zu zahlreichen KI-Riesen, die ebenfalls bereits seit den ersten Reasoning-Modellen wie OpenAI o1 daran arbeiten, für das RL geeignete Feedback-Daten zu liefern. Das können Rohdaten, Verifier oder eben "echte" Umgebungen sein. Je komplexer die zu bewältigende Aufgabe ist, desto komplexer muss auch diese Umgebung sein.
Softwareentwicklung: das erste und letzte Opfer?
Aus Sicht von Mechanize ist die Softwareentwicklung ein besonders geeigneter Startpunkt, da sie sich in klar definierbare Aufgaben zerlegen lässt und mit bestehenden Tools bereits eine gewisse Automatisierung bietet. Gleichzeitig ist sie komplex genug, um als Testfeld für echte agentenartige KI zu dienen. Paradoxerweise könnte die Softwareentwicklung somit eine der ersten, aber auch eine der letzten Wissensarbeitsbranchen sein, die vollständig automatisiert wird.
Während KI bereits jetzt viele Teilaufgaben übernimmt, von der Code-Vervollständigung bis hin zu Tests, bleiben andere Bereiche wie Architekturentscheidungen, Teamkoordination oder die langfristige Wartung schwer automatisierbar. Doch auch diese Aufgaben könnten im Lauf der Zeit in den Bereich der KI fallen, wenn Lernumgebungen, wie Mechanize sie aufbauen will, die nötige Komplexität und Rückkopplung bieten.