Themen Hub KI in der Praxis
Künstliche Intelligenz ist im Alltag gegenwärtig – vom „Googeln“ über Gesichtserkennung bis zum Staubsaugerroboter. KI-Werkzeuge werden immer elaborierter und unterstützen Menschen und Unternehmen effektiver bei ihren Aufgaben, etwa bei der Generierung von Grafiken, beim Texten oder Coden oder bei der Interpretation großer Datenmengen.
Welche KI-Werkzeuge gibt es, wie funktionieren sind, wie helfen sie im Alltag – und wie verändern sie unser Leben? Mit diesen Fragen befassen wir uns in der Rubrik Künstliche Intelligenz in der Praxis.
OpenAI entwickelt neue ChatGPT-Agenten, die das Erstellen und Bearbeiten von Präsentationen und Tabellen direkt im Chat ermöglichen, berichtet The Information unter Berufung auf eine Person mit Zugang zu den Funktionen. Die Dateien sind mit PowerPoint und Excel kompatibel, ohne dass die Microsoft-Apps selbst verwendet werden müssen. OpenAI nutzt dabei die offenen Dateiformate von Microsoft. Ziel ist es, ChatGPT als zentrale Arbeitsplattform zu positionieren und unabhängiger von Microsoft- und Google-Tools zu machen. Weitere Agenten sollen Berichte aus Unternehmens- oder öffentlichen Daten generieren und einfache Aufgaben wie Terminbuchungen auf Webseiten übernehmen. Die Agenten können laut der Quelle jedoch langsam oder fehleranfällig sein. Auch eine Zusammenarbeit mehrerer Nutzer an Dokumenten ist geplant, aber noch nicht veröffentlicht. Die Pläne dürften die ohnehin angespannte Beziehung zwischen Microsoft und OpenAI weiter belasten.
Grok hat in seiner iOS-App zwei interaktive KI-Avatare eingeführt: Ani, eine Anime-Figur, und Rudy, ein roter Panda mit wechselnden Stimmungen. Nutzer können per Sprache mit ihnen sprechen, Hintergründe ändern und durch Gespräche neue Funktionen freischalten, darunter einen NSFW-Modus. Weitere Avatare wie „Chad“ sind bereits angekündigt. Nutzer benötigen einen SuperGrok-Account, es werden alle für Groks Sprachmodus verfügbaren Sprachen unterstützt. Für Android ist das Feature bisher nicht verfügbar.

Google erweitert seine KI-gestützte Notiz-App NotebookLM um eine kuratierte Sammlung Notizbücher. Dazu gehören Inhalte von The Economist, The Atlantic sowie von Forschern, Autoren und gemeinnützigen Organisationen. Nutzer können Originaltexte lesen, Fragen stellen und Zusammenfassungen mit Quellenangaben erhalten. Neu sind auch vorgenerierte Audioüberblicke und Mind Maps zur Themenübersicht. Die erste Sammlung bietet unter anderem Langlebigkeitsratschläge, eine Yellowstone-Reiseführung, Shakespeares Werke und Finanzdaten großer Unternehmen. Die Funktion baut auf der Möglichkeit auf, Notizbücher öffentlich zu teilen – laut Google wurden seit dem Start über 140.000 davon veröffentlicht.
Googles neues Text-Embedding-Modell "gemini-embedding-001" ist ab sofort über die Gemini API und Vertex AI allgemein verfügbar. Laut Google übertrifft das Modell sowohl frühere eigene Modelle als auch externe Angebote in verschiedenen Anwendungsbereichen. Es unterstützt über 100 Sprachen, verarbeitet bis zu 2048 Token pro Eingabe und nutzt die Matryoshka Representation Learning (MRL)-Technik, um die Ausgabegröße flexibel zu reduzieren. Das soll den Speicherbedarf und die Rechenkosten senken. Seit dem experimentellen Start im März belegt das Modell laut Google einen Spitzenplatz auf dem MTEB-Multilingual-Leaderboard. Die Nutzung kostet 0,15 US-Dollar pro eine Million Eingabetoken.

Elon Musks Raumfahrtfirma SpaceX steckt zwei Milliarden US-Dollar in Elon Musks KI-Firma xAI. Die Investition ist laut Wall Street Journal Teil einer fünf Milliarden Dollar schweren Finanzierungsrunde. xAIs Chatbot Grok wird bereits im Kundensupport von SpaceX' Satelliteninternet Starlink eingesetzt.
Bei X kündigte Musk an, auch seine E-Autofirma Tesla könne sich an xAI beteiligen, jedoch müssten darüber Vorstand und Aktionäre entscheiden. Ende März gab Musk bekannt, dass seine KI-Firma xAI den Social-Media-Dienst X schluckt. Die Fusion ermögliche die gemeinsame Nutzung von Daten, Modellen, Rechenleistung und Belegschaft.