Apples KI-Forschungsabteilung hat ein neues KI-Framework namens CAMPHOR vorgestellt. Laut den Entwicklern soll das System komplexe Nutzeranfragen lokal auf Mobilgeräten verarbeiten und dabei die Privatsphäre der Anwender schützen.
CAMPHOR (Collaborative Agents for Multi-input Planning and High-Order Reasoning On Device) nutzt eine hierarchische Struktur mit mehreren spezialisierten Agenten, die von einem übergeordneten Reasoning-Agenten koordiniert werden. Dieser zerlegt komplexe Aufgaben in Teilschritte und weist sie den Experten-Agenten zu.
Zu den Spezialisten gehören Agenten für persönliche Kontexte, Geräteinformationen, Nutzerwahrnehmung, externes Wissen und Aufgabenausführung. Laut Apple profitiert davon der Datenschutz sowie die Latenz im Vergleich zu serverbasierten Lösungen. Letztere müssen häufig mehrere Anfragen zwischen Server und Gerät austauschen, was die Nutzererfahrung beeinträchtigen kann.
Prompt-Kompression für effiziente Ressourcennutzung
Um die begrenzten Ressourcen von Mobilgeräten optimal zu nutzen, setzt CAMPHOR auf Prompt-Kompression. Dabei werden Funktionsdefinitionen in einzelne Token komprimiert, was den Speicherbedarf drastisch reduziert. Laut der Studie konnte die Anzahl der statischen Prompt-Token für bestimmte Agenten um bis zu 96 Prozent verringert werden.
Diese drastische Reduzierung des Speicherbedarfs geht einher mit nur marginalen Änderungen in der Genauigkeit. Der Plan-F1-Wert, ein Maß für die Genauigkeit der Aufgabenerfüllung, sank lediglich von 39,89 Prozent auf 38,45 Prozent.
Überraschenderweise zeigen die Ergebnisse, dass die feinabgestimmten kleinen Sprachmodelle in CAMPHOR die Leistung großer Sprachmodelle bei personalisierten Aufgaben übertreffen können. In Tests erreichten sie eine um bis zu 35 Prozent höhere Punktzahl bei der Aufgabenerfüllung als geschlossene große Sprachmodelle.
Die Forscher räumen ein, dass das aktuelle CAMPHOR-Framework auf Einzelinteraktionen beschränkt ist. Viele reale Aufgaben erfordern jedoch mehrstufige Gespräche zwischen Nutzer und Assistent. Zukünftige Arbeiten sollen sich darauf konzentrieren, CAMPHOR für Mehrfach-Interaktionen zu erweitern und komplexeres Laufzeit-Feedback sowie Fehlerbehandlungslogik zu integrieren.
KI soll das iPhone steuern - und eines Tages noch viel mehr
Hinter Apples CAMPHOR steht die Vision von KI-Agenten, die in natürlicher Sprache mit den Nutzern interagieren und gleichzeitig ihre Umgebung - etwa die Smartphone-Oberfläche - verstehen und mit ihr interagieren können.
Wenn das Prinzip funktioniert, könnte es auf viele Arbeits- und Lebensbereiche ausgeweitet werden. OpenAI-Chef Sam Altman lässt auch an einer Hardware forschen, die dieses Software-Prinzip ins alltägliche Leben integriert.
OpenAI veröffentlichte zudem kürzlich auf GitHub ein Open-Source-Framework namens "Swarm", ein experimentelles Tool für die Erstellung, Orchestrierung und Bereitstellung von Multi-Agenten-Systemen. Swarm soll die Koordination und Ausführung von Agenten leichtgewichtig, kontrollierbar und einfach testbar machen.
Das wird durch zwei Kernkonzepte erreicht: Routinen, die Anweisungen und Werkzeuge enthalten, und Übergaben, die es Agenten ermöglichen, Gespräche weiterzuleiten. OpenAI betont, dass Swarm derzeit ein experimentelles Beispielframework ist und nicht für den produktiven Einsatz gedacht ist.