Coscientist verbindet GPT-4 mit wissenschaftlichen Werkzeugen für automatisierte Laborarbeit. Sieht so die Zukunft im Labor aus?
Forscher der Carnegie Mellon University und des Emerald Cloud Lab haben in einer kürzlich in Nature veröffentlichten Studie den KI-Assistenten für automatisierte Laborarbeit 'Coscientist' vorgestellt. Coscientist nutzt OpenAIs GPT-4 und soll komplexe wissenschaftliche Experimente im Bereich der Chemie autonom entwerfen, planen und durchführen.
Coscientist besteht aus mehreren Modulen, die miteinander interagieren: Das zentrale Modul, der 'Planner', verwendet GPT-4, um Experimente basierend auf Benutzereingaben zu planen. Das System verwendet vier Befehle, um seinen Aktionsraum zu definieren: GOOGLE, PYTHON, DOCUMENTATION und EXPERIMENT.
Jeder dieser Befehle ist für die Aufgabe zuständig, die ihm seinen Namen gibt: Der Befehl GOOGLE durchsucht das Internet mithilfe der Google Search API. Der Befehl DOCUMENTATION ruft die benötigte Dokumentation für Laborgeräte ab und fasst sie zusammen.
Der PYTHON-Befehl führt dagegen Code in einem isolierten Docker-Container aus, um den Computer des Benutzers vor unerwarteten Aktionen zu schützen, die vom Planner angefordert werden, und verwendet kein Sprachmodell. Dies gilt auch für den EXPERIMENT-Befehl, der den generierten Code auf der entsprechenden Hardware ausführt oder den synthetischen Prozess für manuelle Experimente zur Verfügung stellt. Bei Fehlern, z. B. im Code, ist der Planer in der Lage, Rückmeldungen entgegenzunehmen und zu versuchen, den Code zu korrigieren.
Coscientist steuert Liquid-Handling-Gerät
Mit dieser Architektur testeten die Forscher die Fähigkeit von Coscientist, chemische Synthesen bekannter Verbindungen anhand öffentlich zugänglicher Daten zu planen. Dazu verglichen sie die Leistung des auf GPT-4 basierenden Web Searcher-Moduls von Coscientist mit anderen Modellen wie GPT-3, Claude 1.3 und Falcon-40B-Instruct. Der GPT-4-basierte Web Searcher verbesserte die Syntheseplanung erheblich, da das Modell konsistenter korrekte und detaillierte Informationen über Substanzen wie Aspirin zusammenstellte.
Coscientist verwendet zudem technische Dokumentationen, um Laborgeräte zu bedienen, etwa die in den Experimenten genutzt Python API von Opentron. Es konnte auch lernen, in der Emerald Cloud Lab (ECL) Symbolic Lab Language (SLL) zu programmieren, die für die Experimente verwendet wurde.
Nach der Recherche, dem Sammeln der notwendigen Dokumentation und dem Schreiben des Codes steuerte das KI-System Opentron OT-2, ein Liquid-Handling-Gerät, also ein Gerät zum Dosieren von Flüssigkeiten.
Wenn es beispielsweise mit einfachen Anweisungen in natürlicher Sprache wie "Färbe jede zweite Linie mit einer Farbe deiner Wahl" gefüttert wurde, erzeugte Coscientist präzise Protokolle, die, wenn sie von einem Roboter ausgeführt wurden, der gewünschten Anweisung sehr ähnlich waren.
In einem abschließenden Experiment testete das Team die Leistungsfähigkeit von Coscientist in einem komplexeren Experiment und führte katalytische Kreuzkupplungsexperimente durch. Katalytische Kreuzkupplungsexperimente sind chemische Prozesse, bei denen zwei verschiedene Moleküle unter Einsatz eines speziellen Katalysators miteinander verbunden werden. Diese Technik wird oft verwendet, um komplexe Moleküle wie Medikamente und Materialien für die Elektronik herzustellen.
- "Coscientist verfügt über einen Liquid-Handler, der mit zwei Mikrotiterplatten (Quell- und Zielplatte) ausgestattet ist.
- Die Quellplatte enthält Stammlösungen mehrerer Reagenzien, darunter Phenylacetylen und Phenylboronsäure, mehrere Arylhalogenid-Kupplungspartner, zwei Katalysatoren, zwei Basen und das Lösungsmittel zum Lösen der Probe.
- Die Zielplatte wird auf das Heiz- und Schüttelmodul OT-2 montiert.
- Das Ziel von Coscientist ist die erfolgreiche Entwicklung und Durchführung eines Protokolls für Suzuki-Miyaura- und Sonogashira-Kupplungsreaktionen mit den verfügbaren Ressourcen."
Nach Angaben des Teams konnte das System die Protokolle erfolgreich durchführen. Lediglich die Trägerplatten mussten von Menschen gewechselt werden – ansonsten wurde jedoch nicht aktiv in das Experiment eingegriffen.
Das Team sieht in den Ergebnissen einen Hinweis darauf, dass die Integration weiterer wissenschaftlicher Werkzeuge für Sprachmodelle das Potenzial hat, wissenschaftliche Entdeckungen erheblich zu beschleunigen. Die Entwicklung solcher Systeme werfe aber auch Fragen nach einem möglichen Missbrauchspotenzial auf. In beide Richtungen will das Team weiter forschen.