IBM hat seine quelloffenen Granite-Sprachmodelle auf Version 3.1 aktualisiert. Die Modelle wurden mit 12 Billionen Token in zwölf Sprachen und 116 Programmiersprachen trainiert und nutzen eine neue Dense-Architektur mit einem erweiterten Kontextfenster von 128.000 Token. Laut IBM eignen sich die unter der Apache 2.0-Lizenz stehenden Modelle für verschiedene Aufgaben wie die Beantwortung komplexer Fragen mit externen Daten (RAG), die Extraktion von Informationen aus unstrukturierten Daten und die Zusammenfassung von Dokumenten. In allgemeinen, geschäftlichen und Sicherheitstests sollen die Granite 3.1-Modelle Spitzenleistungen erzielen im Vergleich zu ähnlich großen Open-Source-Modellen. Die Modelle sind auf Hugging Face verfügbar. Die ersten Granite-Modelle kamen im Mai 2024 raus.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!