Google führt beim Sprachmodell Gemini 2.5 "implizites Caching" ein. Damit werden wiederkehrende Inhalte automatisch erkannt und nur einmal berechnet, was die Kosten für Entwickler laut Google um bis zu 75 Prozent senken kann. Im Gegensatz zum bisherigen expliziten Caching müssen Nutzer dafür keinen eigenen Cache mehr erstellen. Um die Chance auf Kosteneinsparungen zu erhöhen, empfiehlt Google, den stabilen Teil eines Prompts – also z. B. die Systemanweisung – am Anfang zu platzieren und erst danach nutzerspezifische Eingaben wie Fragen einzufügen. Die Funktion gilt für Gemini 2.5 Flash ab 1024 Tokens und für Pro-Versionen ab 2048 Tokens. Weitere Details und Empfehlungen zur Nutzung stehen in der Gemini-API-Dokumentation.

Anzeige
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!