Anzeige
Skip to content

GTC 2026: Nvidia bringt mit Groq-3-LPX erstmals spezialisierte Inferenz-Hardware ins eigene Ökosystem

Eigene CPU-Racks, spezialisierte Inferenzchips, eine neue Speicherarchitektur, ein Inferenz-Betriebssystem, offene Modellallianzen und Agenten-Sicherheitssoftware: Auf der GTC 2026 füllt Nvidia die zur CES vorgestellte Vera-Rubin-Plattform mit einer Reihe neuer Bausteine.

Anzeige
Read full article about: Mistral AI veröffentlicht Mistral Small 4 als kleinen Open-Weight-Allrounder

Mistral AI hat mit Mistral Small 4 ein neues Modell veröffentlicht, das schnelle Textantworten, logisches Denken und Bildverarbeitung in einem vereint. Obwohl das Modell 119 Milliarden Parameter hat, sind pro Anfrage nur 6 Milliarden aktiv, da eine Architektur mit 128 Experten-Modulen jeweils nur vier davon gleichzeitig nutzt. Nutzer können ähnlich zur Konkurrenz über einen Parameter steuern, ob das Modell schnell oder gründlich antworten soll. Laut Mistral AI ist es 40 Prozent schneller und verarbeitet dreimal mehr Anfragen pro Sekunde als der Vorgänger.

Balkendiagramm zeigt die Benchmark-Ergebnisse von Mistral Small 4 High im Vergleich zu Magistral Medium 1.2 und Magistral Small 1.2 in den Kategorien LCR, AIME25, Collie und LiveCodeBench.
Mistral Small 4 mit hoher Reasoning-Stufe erreicht in internen Benchmarks ähnliche oder bessere Werte als die spezialisierten Magistral-Modelle.

Das Modell steht unter der offenen Apache-2.0-Lizenz und ist über Hugging Face, die Mistral API sowie Nvidia-Plattformen verfügbar. Mistral AI tritt zudem der Nvidia Nemotron Coalition bei, einem Zusammenschluss von Unternehmen, der die Entwicklung offener KI-Modelle vorantreiben soll. Bereits Anfang Dezember hatte Mistral AI mit der Mistral-3-Reihe neue multimodale Open-Source-Modelle veröffentlicht, darunter das Flaggschiff Mistral Large 3 mit 675 Milliarden Parametern.

OpenAI plant Milliarden-Joint-Venture mit Private-Equity-Firmen für KI-Vertrieb

OpenAI will seine KI schneller in große Unternehmen bringen und setzt dafür nicht nur auf neue Technik, sondern auf Vertrieb, Partner und Kapital. Gespräche über ein 10-Milliarden-Dollar-Joint-Venture und einen neuen Deployment-Arm zeigen: Der harte Teil beginnt erst nach dem Modellstart, nämlich bei der Einführung in echte Firmenabläufe.

Anzeige

OpenAIs eigene Berater warnen vor Erotik-Modus und sprechen von "sexy Suizid-Coach"

OpenAIs Beratergremium für Wohlbefinden soll sich einstimmig gegen den geplanten Adult Mode für ChatGPT ausgesprochen haben. Intern kämpft das Unternehmen mit einer fehleranfälligen Alterserkennung und ungelösten Sicherheitsproblemen.

Anzeige
Read full article about: Alibaba gründet "Token Hub": Neue KI-Sparte soll Forschung, Apps und Geräte unter einem Dach vereinen

Alibaba bündelt seine KI-Aktivitäten in einer neuen Geschäftseinheit namens "Alibaba Token Hub" (ATH), die CEO Eddie Wu direkt leitet, berichtet Bloomberg. Die Einheit vereint das Forschungsteam hinter den Qwen-Modellen, die Verbraucher-App-Sparte, die Kommunikationsplattform DingTalk sowie Geräte der Marke Quark wie Smart Glasses.

Ziel soll es sein, die Zusammenarbeit zwischen Forschung, Produktentwicklung und Vertrieb zu beschleunigen und KI besser zu vermarkten. Der Name "Token Hub" verweist direkt auf die Abrechnungseinheiten im KI-Geschäft.

Alibaba plant laut Insidern zudem noch diese Woche einen KI-Agenten für Firmenkunden vorzustellen, der auf Qwen basiert und schrittweise mit Taobao und Alipay verknüpft werden soll. Die Umstrukturierung folgt auf den überraschenden Abgang von Qwen-Forschungsleiter Junyang Lin Anfang März. Chinesische KI-Anbieter haben es laut Bloomberg schwerer als westliche Konkurrenten wie OpenAI, mit KI Geld zu verdienen, da chinesische Nutzer ungern für Software-Abos zahlen.