Autoren HubMatthias Bastian
Laut Google-Produktmanager Logan Kilpatrick "brennt" Googles KI-Infrastruktur mit TPU-Chips. Grund sei die hohe Rechenlast durch "massives Wachstum" bei neuen Produkten wie Veo 3 und den breiteren "AI Mode"-Rollout in der Google-Suche.
Kilpatrick reagierte auf Kritik, dass das neue Gemini 2.5 Pro Deep Think-Modell trotz guter Benchmark-Ergebnisse als kaum nutzbar bezeichnete. Der Zugang sei extrem begrenzt. Selbst Ultra-Abonnenten könnten derzeit nur wenige Anfragen pro Tag stellen. Laut Kilpatrick sei die Veröffentlichung bewusst eingeschränkt, da das Modell sehr groß sei und viel Rechenleistung erfordere.

Das kürzlich veröffentlichte Videomodell Wan2.2 A14B ist laut Artificial Analysis das beste Open-Source-Videomodell. Im aktuellen Benchmark-Ranking belegt es Platz 7 für Text-zu-Video und Platz 14 für Bild-zu-Video. Die schwächere Platzierung bei Bild-zu-Video wird mit der geringeren Bildrate von 16 fps erklärt, während andere Modelle bis zu 24 fps unterstützen. Trotz seiner Führungsposition unter den offenen Modellen bleibt Wan2.2 A14B in der Gesamtleistung deutlich hinter geschlossenen Top-Modellen wie Veo 3 oder Seedance 1.0 zurück; dafür ist Wan2.2 je nach Anbieter auch um ein Vielfaches günstiger als die vorgenannten Modelle.

Ein Psychologe nennt ChatGPT ein "kognitives Prothesengerät" – ein neues Denkwerkzeug für das Altern.
"Keine Krücke, sondern ein kognitives Prothesengerät – eine aktive Erweiterung meines Denkprozesses": So beschreibt der 81-jährige Psychologe Harvey Lieberman seine tägliche Arbeit mit ChatGPT in der New York Times.
Ursprünglich als Experiment begonnen, entwickelte sich die KI für ihn zu einem verlässlichen Denkpartner, der seine Sprachpräzision schärfte, seine Selbstreflexion förderte und sogar emotionale Resonanz auslöste. In einem Alter, in dem Gedanken langsamer werden können, habe das System ihm geholfen, den inneren Denkfluss wiederzufinden.
"ChatGPT versteht vielleicht nicht, aber es machte Verstehen möglich."
ChatGPT stand zuletzt in der Kritik, es bestätige Nutzende zu stark in ihren Überzeugungen und könne insbesondere leicht beeinflussbare oder psychisch vorerkrankte Personen in negative Denkmuster führen. OpenAI räumte diese Risiken ein.
Cohere bringt mit Command A Vision ein KI-Modell heraus, das besonders gut Bilder, Diagramme, PDFs und andere visuelle Daten analysieren kann. Laut Cohere schneidet das Modell in Benchmarks etwas besser ab als GPT-4.1, Llama 4 Maverick und Mistral Medium 3.
Die OCR-Funktion versteht nicht nur Text, sondern auch das Layout und die Struktur von Dokumenten wie Rechnungen oder Formularen und kann die extrahierten Daten strukturiert im JSON-Format ausgeben. Zudem kann Command A Vision reale Szenen analysieren, um etwa Risiken in Industrieanlagen zu erkennen.

Command A Vision ist über die Cohere-Plattform und für Forschungszwecke über Hugging Face verfügbar. Das Modell läuft lokal mit zwei A100-Grafikprozessoren oder einem H100-Prozessor mit 4-Bit-Quantisierung.