Anzeige
Skip to content
Read full article about: Google verbessert "Search Live" mit neuer KI-Stimme

Google stellt seine neue Such-Stimme für "Search Live" vor. Dank eines neuen Gemini-Modells für Audio klingen die Antworten nun natürlicher und flüssiger, teilt Google in seinem Blog mit. Search Live ermöglicht Gespräche in Echtzeit und zeigt dabei passende Webseiten an. Die Funktion ist Teil des sogenannten "AI Mode" der Google-Suche.

Die Aktualisierung wird in der kommenden Woche für alle Search-Live-Nutzer in den USA verfügbar sein. Nutzer können die Google-App auf Android oder iOS öffnen, auf das Live-Symbol tippen und ihre Frage laut stellen.

Das langfristige Ziel ist für Google, wie auch für OpenAI, einen nützlichen Alltagsassistenten zu entwickeln, der dem Nutzer möglichst viele Aufgaben einfach per Sprachbefehl abnehmen kann.

Read full article about: Runway stellt erstes "General World Model" vor und erweitert Gen-4.5 um neue Funktionen

Runway verbessert Gen-4.5 und hat GWM-1 vorgestellt, das erste sogenannte "General World Model" des Unternehmens. Gen-4.5 unterstützt nun native Audioerzeugung und Audiobearbeitung sowie Multi-Shot-Editing, bei dem Änderungen in einer Szene auf das gesamte Video übertragen werden können.

Das neue GWM-1 baut eine interne Darstellung einer Umgebung auf und nutzt diese, um künftige Ereignisse in Echtzeit zu simulieren. Es basiert auf Gen-4.5 und erzeugt Videos Bild für Bild, die sich interaktiv steuern lassen – etwa durch Kamerabewegungen, Roboterbefehle oder Audio.

Das Weltmodell gibt es in drei Varianten: GWM Worlds für erkundbare Umgebungen, GWM Avatars für sprechende Charaktere mit realistischer Mimik und Lippensynchronisation, sowie GWM Robotics zur Erzeugung synthetischer Trainingsdaten für Roboter. Zukünftig sollen die Bereiche in einem Modell vereint werdne.

Auch andere Labore wie Google Deepmind oder das neue Start-up des KI-Forschers Yann LeCun möchten solche Weltmodelle als Weiterentwicklung und Erweiterung herkömmlicher Sprachmodelle ohne Weltverständnis entwickeln.

Google stellt neuen Deep-Research-Agenten und neue KI-API vor

Google aktualisiert sein Deep-Research-System mit einer neuen Version basierend auf Gemini 3 Pro. Entwickler „freuen“ sich über einen neuen API-Standard, der agentische Fähigkeiten besser unterstützen soll.

Read full article about: Google stellt neue KI-Suche-Funktionen für mehr Sichtbarkeit für Webseiten vor

Google stellt neue Funktionen vor, um Webseiten in der KI-Suche mehr Sichtbarkeit zu geben. Oder wie mein Kollege Max es sagt: "Toll, das Internet ist gerettet." Im "AI Mode" zeigt Google künftig mehr Links und ergänzt kurze Hinweise, warum sie nützlich sein könnten. Auch Inline‑Links sollen stärker eingebunden werden. Bisherige Studien zeigen, dass KI-Antworten die Klickzahlen auf Webseiten massiv reduzieren.

Google

Links von abonnierten und beliebten Medien werden außerdem in einem eigenen Karussell angezeigt, zuerst in der Gemini‑App. Das passiert auf Basis von Abos und der bevorzugten Nachrichtenquellen von Nutzern.

Zudem testet Google mit Verlagen wie „Der Spiegel“ und „The Guardian“ KI‑basierte Artikelüberblicke und Audio‑Briefings in Google News. Für Echtzeitdaten in der Gemini‑App arbeitet Google unter anderem mit der Associated Press zusammen. Solche exklusiven Kooperationen sind Kalkül: Google schafft so ein Gefangenendilemma für andere Webseiten‑Betreiber.

Die Ankündigungen kommen kurz nachdem die EU mitgeteilt hat, ein Kartellverfahren wegen möglichem Marktmissbrauch bei der KI-Datennutzung gegen Google zu eröffnen.

Read full article about: Meta plant geschlossenes KI-Modell "Avocado" und bricht mit seiner Open-Source-Linie

Meta richtet seine Arbeit auf ein neues KI-Modell mit dem Namen Avocado aus, das laut mit der Planung vertrauten Personen im kommenden Frühjahr erscheinen könnte. Es soll als geschlossenes Modell starten, damit Meta Zugang verkaufen kann. Das wäre ein klarer Wechsel von der bisher offenen Linie. Die Führung setzt dafür stark auf Alexandr Wang, der nach dem Deal mit Scale AI ins Unternehmen kam. Intern verlor die offene Strategie angeblich an Gewicht, nachdem Llama 4 enttäuscht hatte.

Laut Quellen von Bloomberg nutzt das Team für das Training von Avocado mehrere externe Modelle, darunter Gemma von Google, gpt-oss von OpenAI und Qwen von Alibaba. Die Verwendung chinesischer Technik steht im Widerspruch zu früheren Warnungen von CEO Mark Zuckerberg vor Zensur durch China.

Deepseek soll tausende geschmuggelte Nvidia-Chips fürs KI-Training nutzen

Deepseek entwickelt sein nächstes großes KI-Modell offenbar mit Tausenden von Nvidias neuesten Blackwell-Chips, obwohl diese wegen US-Exportverboten gar nicht nach China geliefert werden dürfen. Ein Bericht des Tech-Dienstes The Information, der sich auf sechs eingeweihte Quellen stützt, birgt erheblichen politischen Sprengstoff.

Read full article about: Devstral 2: Mistral AI veröffentlicht neue offene KI-Modelle für Programmierung

Mit Devstral 2 und Devstral Small 2 veröffentlicht Mistral AI eine neue Familie von Open-Source-Modellen für die Programmierung. Devstral 2 mit 123 Milliarden Parametern erreicht im SWE-Bench Verified Benchmark 72,2 Prozent und übertrifft damit viele andere offene Modelle. Laut Mistral AI ist es bis zu siebenmal kosteneffizienter als Claude Sonnet. Es benötigt vier H100-Class-GPUs. Das kleinere Modell Devstral Small 2 (24 Milliarden Parameter) lässt sich dagegen auf handelsüblicher Hardware lokal betreiben.

Während Devstral Small 2 unter der freien Apache-2.0-Lizenz steht, erscheint das große Devstral 2 unter einer "Modified MIT License" mit Umsatzgrenze: Unternehmen mit mehr als 20 Millionen US-Dollar Monatsumsatz müssen eine kommerzielle Lizenz beantragen oder das Modell via API nutzen. Diese Einschränkung gilt auch für alle Ableitungen oder Modifikationen (Fine-Tunes) des Modells.

Ergänzend führt das Unternehmen Mistral Vibe ein, ein Open-Source-Tool für die Befehlszeile. Vibe ermöglicht es Entwicklern, Code-Änderungen über mehrere Dateien hinweg mittels natürlicher Sprache zu automatisieren und Fehler zu beheben. Devstral 2 ist zunächst kostenlos über die API verfügbar, später kostet es 0,40 US-Dollar pro Million Input-Token.

OpenAI, Anthropic und mehr: "Big AI" will gemeinsamen Standard für KI-Agenten schaffen

Die Linux Foundation gründet die Agentic AI Foundation. Anthropic, OpenAI und Block steuern drei Open-Source-Projekte bei, während sich nahezu alle großen Technologiekonzerne als Mitglieder anschließen.