Inhalt
summary Zusammenfassung

PaLM-2 ist das bisher leistungsstärkste Sprachmodell von Google und soll viele KI-Services des Unternehmens antreiben. Außerdem bestätigt Google: "Project Gemini" existiert.

Anzeige

Google hat PaLM-2 auf der Google I/O vorgestellt und bezeichnet es als Sprachmodell der nächsten Generation. Im Vergleich zu seinem Vorgänger PaLM soll es mehr Sprachen sprechen, besser schlussfolgern und kodieren können. Dazu wurde PaLM-2 mit Texten aus über 100 verschiedenen Sprachen, zahlreichen wissenschaftlichen Publikationen, mathematischen Webseiten und Code-Datenbanken trainiert.

Das kleinste PaLM-2-Modell soll auf mobilen Geräten laufen

Genaue Angaben zur Größe gibt es nicht, aber laut Google soll das Modell in vier verschiedenen Größen erhältlich sein: Gecko, Otter, Bison und Unicorn. Die kleinste Variante Gecko soll sogar auf mobilen Geräten laufen und so interaktive On-Device-Anwendungen ermöglichen - auch wenn das Gerät offline ist.

PaLM-2 treibt auch Googles Chatbot Bard sowie KI-Funktionen in Workspace-Anwendungen wie Gmail und Google Docs an. Das Sprachmodell von Google ist auch in zwei spezialisierten Varianten erhältlich: Med-PaLM-2 für die Medizin und Sec-PaLM für Anwendungen in der Cybersicherheit. Das bereits bekannte Modell Med-PaLM-2 soll zusätzlich multimodale Fähigkeiten erhalten, um beispielsweise Röntgenbilder direkt auswerten zu können.

Anzeige
Anzeige

PaLM-2 und die Spezialmodelle sind - mit Einschränkungen - über die PaLM-API von Google verfügbar.

"Projekt Gemini" bereits in der Entwicklung

Mit der Ankündigung von PaLM-2 nahm Google auch Stellung zur Zusammenlegung der Teams Brain und Deepmind und zu den Gerüchten um "Project Gemini". Das Team "ebnet verantwortungsvoll den Weg für die nächste Generation von KI-Modellen" und arbeitet bereits an Gemini, dem nächsten multimodalen Modell.

Gemini sei von Grund auf multimodal, hocheffizient bei der Integration von Tools und APIs und für zukünftige Innovationen wie Speicherung und Planung ausgelegt. Gemini befindet sich noch in der Entwicklungsphase, zeigt aber bereits multimodale Fähigkeiten, die bei früheren Modellen noch nicht zu sehen waren.

"Nach der Feinabstimmung und strengen Sicherheitstests wird Gemini, wie PaLM 2, in verschiedenen Größen und mit unterschiedlichen Leistungsmerkmalen erhältlich sein, um sicherzustellen, dass es in einer Vielzahl von Produkten, Anwendungen und Geräten zum Nutzen aller eingesetzt werden kann", so Google.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • PaLM-2 ist das bisher leistungsstärkste Sprachmodell von Google und wird in vier Größen angeboten.
  • Neben PaLM-2 zeigt Google auch Multimodalität für Med-PaLM-2 und das auf Cybersecurity spezialisierte Sec-PaLM.
  • Google bestätigt "Project Gemini", das Modell ist multimodal und soll in Zukunft auch mit Planungs- und Speicherfunktionen ausgestattet werden.
Max ist leitender Redakteur bei THE DECODER. Als studierter Philosoph beschäftigt er sich mit dem Bewusstsein, KI und der Frage, ob Maschinen wirklich denken können oder nur so tun als ob.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!