Praxis Archive

12. Mai 2025

Versicherer am Lloyd’s-Markt in London bieten erstmals spezielle Policen an, die Schäden durch Fehler von KI-Chatbots abdecken. Entwickelt wurde das Produkt vom Start-up Armilla, das von Y Combinator unterstützt wird. Die Versicherung greift, wenn ein Unternehmen wegen fehlerhafter KI-Leistung verklagt wird – etwa durch Kunden, die durch falsche Auskünfte oder sogenannte „Halluzinationen“ der KI geschädigt wurden. Abgedeckt sind unter anderem Anwaltskosten und Schadenersatz. Ein Beispiel ist Air Canada: Ein Chatbot hatte einen nicht existierenden Rabatt versprochen, den die Airline später einlösen musste. Laut Armilla hätte die neue Police in einem solchen Fall gegriffen, wenn die Leistung des Bots deutlich unter den Erwartungen lag. Laut Karthik Ramakrishnan, CEO von Armilla, soll das Produkt Unternehmen den Einstieg in KI erleichtern. Bestehende Technologieversicherungen decken KI-Risiken oft nur zu geringen Teilen. Armilla versichert gezielt den Leistungsabfall von KI-Modellen.

Kommentieren

Maximilian Schreiner

12. Mai 2025

Praxis

Microsoft könnte OpenAI-Anteile opfern - will aber Zugriff auf KI-Technologie sichern

OpenAI CEO Sam Altman and Microsoft CEO Satya Nadella standing next to each other, smiling into the camera.

Matthias Bastian

11. Mai 2025

Update

Praxis

US-Copyright-Behörde widerspricht KI-Industrie: Kein generelles Fair Use beim KI-Training

Matthias Bastian

11. Mai 2025

Praxis

Wer kurze KI-Antworten fordert, bekommt laut Studie mehr Halluzinationen

Matthias Bastian

10. Mai 2025

Praxis

Google fasst Pläne und Beispiele für generative KI im Gaming zusammen

Maximilian Schreiner

10. Mai 2025

Praxis

Chatbots in der Medizin: Fünf Hürden bremsen den Einsatz

Matthias Bastian

10. Mai 2025

Praxis

Qwen startet "Web Dev"-Funktion für Webseiten- und App-Entwicklung

Mit der neuen "Web Dev"-Funktion von Qwen will Alibaba die Erstellung von Webseiten und Apps vereinfachen. Nutzer sollen ohne Programmierkenntnisse mit einem einzigen Prompt vollständigen Frontend-Code erhalten.

Matthias Bastian

10. Mai 2025

Praxis

Eine Analyse von Artificial Analysis zeigt die KI-Preissteigerung durch Reasoning-Prozesse am Beispiel von Googles Gemini Flash 2.5. Die Betriebskosten des Modells sind 150-mal höher als bei Gemini Flash 2.0. Grund dafür sind deutlich teurere Ausgabetoken – 3,5 US-Dollar pro Million Token mit Reasoning, im Vergleich zu 0,4 Dollar bei 2.0 – sowie eine 17-fach höhere Token-Nutzung bei den Tests. Gemini 2.5 Flash verbraucht damit so viele Token für logische Schlussfolgerungen wie kein anderes Modell. OpenAIs o4-mini ist pro Token zwar teurer, verbrauchte im Benchmark aber weniger Token, was zu geringeren Gesamtkosten führte.

Balkendiagramm mit dem Titel „Cost to Run Artificial Analysis Intelligence Index“. Es zeigt die Gesamtkosten in US-Dollar, um alle Tests im Artificial Analysis Intelligence Index mit verschiedenen KI-Modellen durchzuführen. Die Balken sind in drei Farben unterteilt: Input (blau), Reasoning (lila), Output (grün).Links stehen die teuersten Modelle:

GPT-3 ($1951),

Claude 3 Opus ($1485),

Gemini 2.5 Pro ($844).

In der Mitte:

Gemini 2.5 Flash mit Reasoning ($445),

o4-mini (high) ($323).

Rechts die günstigsten Modelle:

Gemini 2.0 Flash ($3),

Llama 3 8B ($2).

Ein lila Pfeil darüber zeigt den Kostenunterschied zwischen Gemini 2.0 Flash und Gemini 2.5 Flash mit Reasoning und hebt „150x“ hervor. Quelle ist „Artificial Analysis“. — Die Betriebskosten für Googles Gemini 2.5 Flash mit aktiviertem Reasoning sind 150-mal höher als bei Gemini 2.0 Flash. | Bild: Artificial Analysis

Kommentieren

Matthias Bastian

9. Mai 2025

Praxis

OpenAI erweitert Fine-Tuning-Methoden für KI-Modelle o4-mini und GPT-4.1

Matthias Bastian

9. Mai 2025

Praxis

Google führt beim Sprachmodell Gemini 2.5 "implizites Caching" ein. Damit werden wiederkehrende Inhalte automatisch erkannt und nur einmal berechnet, was die Kosten für Entwickler laut Google um bis zu 75 Prozent senken kann. Im Gegensatz zum bisherigen expliziten Caching müssen Nutzer dafür keinen eigenen Cache mehr erstellen. Um die Chance auf Kosteneinsparungen zu erhöhen, empfiehlt Google, den stabilen Teil eines Prompts – also z. B. die Systemanweisung – am Anfang zu platzieren und erst danach nutzerspezifische Eingaben wie Fragen einzufügen. Die Funktion gilt für Gemini 2.5 Flash ab 1024 Tokens und für Pro-Versionen ab 2048 Tokens. Weitere Details und Empfehlungen zur Nutzung stehen in der Gemini-API-Dokumentation.

Kommentieren