OpenAI und Ginkgo Bioworks optimieren Proteinsynthese mit GPT-5 im Roboterlabor
OpenAI hat gemeinsam mit dem Biotech-Unternehmen Ginkgo Bioworks GPT-5 an ein automatisiertes Labor angeschlossen, um zellfreie Proteinsynthese zu optimieren. Die Ergebnisse sind messbar, die Einschränkungen aber erheblich.
In Bereichen wie Mathematik oder Physik lassen sich Ideen rein rechnerisch überprüfen. Biologie funktioniert anders. Hier läuft der Fortschritt durch das Labor, wo Experimente Zeit und Geld kosten. An dieser Stelle setzt ein neues Projekt von OpenAI und dem Biotech-Unternehmen Ginkgo Bioworks an.
Die beiden Unternehmen haben OpenAIs Sprachmodell GPT-5 mit einem vollautomatisierten Cloud-Labor verbunden. Das Ziel war die Optimierung der sogenannten zellfreien Proteinsynthese (CFPS). Dabei werden Proteine hergestellt, ohne lebende Zellen zu züchten. Stattdessen wird die Proteinproduktionsmaschinerie aus dem Inneren von Zellen in eine kontrollierte Mischung überführt und dort betrieben. Das Verfahren spielt in der Medikamentenentwicklung, Diagnostik und industriellen Enzymproduktion eine Rolle. Es kommt laut dem begleitenden Paper auch bei der kommerziellen Herstellung eines Antikörper-Wirkstoff-Konjugats zum Einsatz.
Die Optimierung von CFPS gilt als schwierig. Die Mischungen bestehen aus vielen interagierenden Bestandteilen, darunter DNA-Vorlagen, Zellextrakte (sogenannte Lysate, die die zelluläre Maschinerie enthalten), Energiequellen, Salze und Cofaktoren. Der Raum möglicher Zusammensetzungen ist riesig, und die Effekte kleiner Änderungen lassen sich mit Intuition allein kaum vorhersagen. Frühere Versuche mit maschinellem Lernen brachten nur schrittweise Verbesserungen.
Sechs Runden, 36.000 Reaktionen, 40 Prozent weniger Kosten
Über sechs Iterationsrunden testete das System laut dem Paper mehr als 36.000 verschiedene Reaktionszusammensetzungen auf 580 automatisierten Mikrotiterplatten. Das sind kleine Kunststoffplatten mit Hunderten winziger Vertiefungen, in denen jeweils eine einzelne Reaktion parallel ablaufen kann. Die spezifischen Produktionskosten für das Testprotein sfGFP (ein fluoreszierendes Standardprotein, das als Benchmark dient) sanken von 698 Dollar pro Gramm auf 422 Dollar pro Gramm. Das entspricht einer Reduktion um 40 Prozent gegenüber dem bisherigen Stand der Technik, den Forscher der Northwestern University im August 2025 veröffentlicht hatten.
Gleichzeitig stieg die Proteinausbeute um 27 Prozent (von 2,39 auf 3,04 Gramm pro Liter Reaktionslösung). Die reinen Reagenzienkosten sanken um 57 Prozent, von 60 auf 26 Dollar pro Gramm.
Zum Vergleich nennen die Autoren den Listenpreis eines kommerziell erhältlichen CFPS-Kits der Firma NEB, der bei rund 800.000 Dollar pro Gramm liegt. Die Zahlen seien allerdings nicht direkt vergleichbar, räumen sie selbst ein.
GPT-5 entwirft, Roboter pipettieren
Der Ablauf folgt einem geschlossenen Kreislauf. GPT-5 entwirft Versuchsanordnungen als digitale Dateien. Ein Validierungssystem auf Basis der Python-Bibliothek Pydantic prüft automatisch, ob die entworfenen Experimente wissenschaftlich sinnvoll und auf der Laborautomatisierung physisch ausführbar sind. Erst dann werden die Designs an Ginkgo Bioworks' Cloud-Labor in Boston übergeben.

Dort führen modulare Robotereinheiten, sogenannte Reconfigurable Automation Carts (RACs), die Versuche automatisch durch. Jeder dieser Wagen enthält ein einzelnes Laborgerät, etwa einen Flüssigkeitshandler, einen Inkubator oder ein Messgerät. Roboterarme und Transportschienen bewegen die Probenplatten zwischen den Stationen. Die Ginkgo-Software Catalyst steuert den Ablauf.
Nach Abschluss der Experimente fließen die Messdaten zurück an GPT-5, das sie analysiert, Hypothesen formuliert und die nächste Versuchsrunde entwirft. Menschliche Eingriffe beschränkten sich laut den Autoren auf die Vorbereitung sowie das Be- und Entladen von Reagenzien und Verbrauchsmaterialien. Insgesamt generierte das System in sechs Monaten rund 150.000 Datenpunkte.
In der ersten Runde entwarf GPT-5 Reaktionszusammensetzungen ohne jegliche vorherige Beispieldaten oder Versuchsergebnisse und stützte sich ausschließlich auf das in seinen Gewichten gespeicherte Wissen. Selbst in diesem sogenannten "Zero-Shot"-Modus lieferte es verwertbare, wenn auch noch nicht optimale Designs.
Werkzeugzugang brachte den Fortschritt
Zu Beginn hatte das System mit erheblicher Streuung in den Messwerten zu kämpfen. Die Abweichungen zwischen Wiederholungen auf derselben Platte lagen teils bei über 40 Prozent. Um die Präzision zu verbessern, mussten Ginkgo-Mitarbeiter Reagenzkonzentrationen und Vorratslösungen manuell anpassen. Damit sanken die Abweichungen auf einen Medianwert von 17 Prozent. Rein autonom war der Prozess also nicht.
Den größten Leistungssprung verzeichnete das System ab der dritten Runde. Zu diesem Zeitpunkt erhielt GPT-5 erstmals Zugang zu einem Computer, dem Internet, Datenanalysepaketen und einem aktuellen Preprint der bisherigen Bestleistung der Forscher der Northwestern University. Zudem bekam das Modell erweiterte Metadaten zurück, darunter Rohdaten, Fehlermeldungen der Flüssigkeitshandhabung und tatsächliche Inkubationszeiten.
Ab Runde 3 konnte GPT-5 eigene Versuchsergebnisse mit Erkenntnissen aus der Fachliteratur kombinieren. In nur zwei Monaten (Runden 3 bis 5) übertraf das System den bisherigen Stand der Technik. Allerdings wurden zeitgleich auch die DNA-Vorlage und das Zelllysat verbessert, was die Zuordnung der Fortschritte erschwert.
GPT-5 antizipierte Erkenntnisse der Fachwelt
GPT-5 schlug Reagenzien wie Nukleosidmonophosphate (NMPs), Kaliumphosphat und Ribose vor, bevor es überhaupt Zugang zum oben erwähnten Preprint hatte. Die Autoren jener Publikation hatten unabhängig dieselben Substanzen als entscheidend identifiziert. Das Modell kam also auf Basis seiner Trainingsdaten und der laufenden Versuchsergebnisse zu ähnlichen Schlüssen wie die Fachwelt.
GPT-5 verfasste darüber hinaus menschenlesbare Labornotizbuch-Einträge, in denen es seine Datenanalysen und Hypothesen dokumentierte. Unter anderem stellte das Modell fest, dass ein günstiger Puffer (HEPES) einen überproportional großen Einfluss auf den Proteinertrag hat, dass Phosphat in einem engen Konzentrations- und pH-Bereich gepuffert sein muss und dass der Zusatz von Spermidin (einer natürlich vorkommenden Substanz, die Nukleinsäuren stabilisiert) die Erträge steigert.
Auch eine ökonomische Beobachtung lieferte das Modell. Die Kosten einer CFPS-Reaktion werden mittlerweile zu über 90 Prozent von Zelllysat und DNA bestimmt. Die Steigerung des Proteinertrags pro Einheit dieser teuren Zutaten ist daher der wirksamste Hebel zur Kostensenkung, nicht Einsparungen bei günstigeren Nebenbestandteilen.
Von den über 20 vorgeschlagenen Zusatzreagenzien fanden sich mehrere in den besten Reaktionszusammensetzungen wieder, darunter NMPs, Glukose, Kaliumphosphat und Katalase.
Wenig Fehler, aber viele offene Fragen
Die Fehlerquote war gering. Von 480 entworfenen Mikrotiterplatten wiesen nur zwei fundamentale Designfehler auf, also weniger als ein Prozent. In einem Fall überschrieb das Modell eine vorgeschriebene Volumenangabe, um Platz für zusätzliche Reagenzien zu schaffen. Im anderen Fall verursachte ein Programmierfehler bei der Einheitenumrechnung eine Platte, die nur Glukose und Ribose enthielt und folglich kein Protein produzierte.
Die Einschränkungen des Projekts wiegen allerdings schwer. Sämtliche Ergebnisse stammen von nur einem einzigen Protein (sfGFP) und einem einzigen CFPS-System. Ob sich die gefundenen Reaktionszusammensetzungen auf andere Proteine übertragen lassen, ist unklar. Bei einem Test mit zwölf weiteren Proteinen waren nur sechs per Gelelektrophorese (einem gängigen Nachweisverfahren) sichtbar. Für andere Zielproteine wäre also weitere Optimierung nötig. Menschliche Aufsicht blieb für Protokollverbesserungen und Reagenzienhandhabung zudem durchgehend erforderlich.
OpenAI und Ginkgo Bioworks wollen den Ansatz laut eigener Aussage auf weitere biologische Prozesse ausweiten. Dass KI-Modelle im Nasslabor eigenständig Protokolle verbessern können, wirft allerdings auch Fragen auf. OpenAI verweist in diesem Zusammenhang auf das hauseigene Preparedness Framework, mit dem solche Fähigkeiten auf Biosicherheitsrisiken hin bewertet werden sollen. Konkrete Maßnahmen, die über diese Absichtserklärung hinausgehen, nennt das Paper nicht.
KI-News ohne Hype – von Menschen kuratiert
Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.
Jetzt abonnierenKI-News ohne Hype
Von Menschen kuratiert.
- Mehr als 20 Prozent Launch-Rabatt.
- Lesen ohne Ablenkung – keine Google-Werbebanner.
- Zugang zum Kommentarsystem und Austausch mit der Community.
- Wöchentlicher KI-Newsletter.
- 6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
- Bis zu 25 % Rabatt auf KI Pro Online-Events.
- Zugang zum kompletten Archiv der letzten zehn Jahre.
- Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.