Anzeige
Skip to content

Jeff Bezos startet milliardenschweres KI-Projekt für Maschinenbau und Raumfahrt

Jeff Bezos steigt erstmals seit seinem Abschied von Amazon wieder operativ in ein Unternehmen ein. Mit seinem neuen KI-Start-up Project Prometheus will er Milliarden in Technologien investieren, die physische Ingenieursarbeiten beschleunigen sollen.

KI-Modell DeepEyesV2 nutzt Werkzeuge statt Wissen - und schlägt größere Konkurrenz

DeepEyesV2 ist ein multimodales KI-Modell, das Bilder analysiert, Code ausführt und das Web durchsucht. Statt mit purem Wissen schlägt DeepEyesV2 größere Modelle mit intelligenter Werkzeugnutzung. Das Modell ist unter der Apache-2.0-Lizenz nutzbar.

Deepmind-Studie will Maschinenblick und menschliche Wahrnehmung aufeinander abstimmen

Ein Forschungsteam von Google DeepMind, deutschen Partnern und Anthropic hat eine Methode vorgestellt, mit der KI-Modelle menschliche Urteilsmuster in der visuellen Wahrnehmung besser nachvollziehen sollen. Die Studie in Nature zeigt, dass solche „human-aligned“ Modelle robuster, generalisierungsfähiger und weniger fehleranfällig sind.

Baidus neues ERNIE-Modell bearbeitet Bilder während des Denkprozesses

Baidu hat mit ERNIE-4.5-VL-28B-A3B-Thinking ein Reasoning-Model veröffentlicht, das Bilder während des Denkprozesses ver- und bearbeiten kann, etwa einzoomen, um Text besser lesen zu können.

Metas neues KI-System versteht und transkribiert gesprochene Sprache in mehr als 1.600 Sprachen

Laut Metas Forschungsabteilung Fundamental AI Research (FAIR) soll Omnilingual ASR gesprochene Sprache in über 1.600 Sprachen transkribieren können, darunter 500 seltene Sprachen. Es kann sich neue Sprachen sogar per Few-Shot-Prompting aneignen.