Anzeige
Skip to content

Chinas KI-Wettlauf: Alibaba stellt Qwen3.5 als kostenloses Open-Weight-Modell vor

Chinesische KI-Labore setzen ihre Modelloffensive fort – heute ist es Alibabas Qwen3.5, das mit einer hybriden Architektur aus linearer Attention und Mixture-of-Experts bei nur 17 Milliarden aktiven Parametern an die Leistung westlicher Spitzenmodelle heranreichen will. Natürlich als Open Weight.

Read full article about: Anthropic plant eigene Rechenzentren und wirbt dafür Ex-Google-Manager an

Anthropic plant massiv in eigene Rechenzentrumskapazitäten zu investieren und hat dafür erfahrene Ex-Google-Manager angeworben, berichtet The Information. Das KI-Unternehmen diskutiert intern den Aufbau von mindestens 10 Gigawatt Kapazität – Kosten: Hunderte Milliarden Dollar. Da Anthropic als Startup keine starke Bonität hat, braucht es finanzstarke Partner als Absicherung. Google sprang bereits bei einem Rechenzentrum in Louisiana als Bürge ein.

Bisher mietet Anthropic Rechenkapazität bei Cloud-Anbietern, will künftig aber auch eigene Rechenzentren leasen. Dafür wurden Tim Hughes von Stack Infrastructure und Brett Rogers eingestellt, der bei Google sechs Jahre lang Rechenzentren baute. Bereits an Bord ist Winnie Leung mit über 20 Jahren Google-Erfahrung.

Zum Vergleich: OpenAI kündigte im letzten Jahr strategische Allianzen mit Nvidia über mindestens 10 Gigawatt, Broadcom, Oracle über 4,5 Gigawatt und AMD über bis zu 6 Gigawatt an. Ob diese Pläne tatsächlich umgesetzt werden und OpenAI wie Anthropic genug Umsatzwachstum erzielen, um die Rechnungen zu begleichen, bleibt offen. Anthropic konnte zuletzt zumindest ein starkes Umsatzwachstum verzeichnen.

Read full article about: Google Deepmind rüstet Denkmodus "Gemini 3 Deep Think" für komplexe Aufgaben auf

Google Deepmind hat seinen spezialisierten Denkmodus "Gemini 3 Deep Think" aufgerüstet und stellt ihn über die Gemini-App sowie als API über ein Vertex AI-Frühzugangsprogramm bereit. Das Upgrade soll bei komplexen Aufgaben in Wissenschaft, Forschung und Ingenieurwesen helfen. Die Gemini-App steht Google AI Ultra-Abonnenten zur Verfügung, Entwickler und Forscher können sich für das API-Programm anmelden.

Laut Google Deepmind erreicht Deep Think Bestwerte auf mehreren Benchmarks: auf ARC-AGI-2 (einem Test für logisches Denken), auf "Humanity's Last Exam" (schwierige Aufgaben aus Mathematik, Naturwissenschaften und Ingenieurwesen) sowie einen Elo-Wert von 3455 auf der Programmierplattform Codeforces.

Benchmark Deep Think Claude Opus 4.6 GPT-5.2 Gemini 3 Pro Preview
ARC-AGI-2 84.6% 68.8% 52.9% 31.1%
Humanity's Last Exam 48.4% 40.0% 34.5% 37.5%
Codeforces 3,455 2,352 - 2,512

Zudem erzielte das Modell bei den Physik- und Chemie-Olympiaden 2025 Ergebnisse auf Goldmedaillen-Niveau. Beispiele für den Einsatz von Deep Think in der Wissenschaft stehen hier.

Read full article about: Isomorphic Labs stellt neue KI-Engine für präziseres Medikamenten-Design vor

Isomorphic Labs, das KI-Medizin-Start-up von Google Deepmind, hat ein neues System namens "Isomorphic Labs Drug Design Engine" (IsoDDE) vorgestellt, das AlphaFold 3 übertreffen soll. Laut dem Unternehmen verdoppelt IsoDDE die Genauigkeit von AlphaFold 3 bei der Vorhersage von Protein-Ligand-Strukturen, die sich stark von den Trainingsdaten unterscheiden.

IsoDDE übertrifft laut Isomorphic Labs bei Strukturvorhersage, Erkennung von Bindungstaschen und Vorhersage der Bindungsstärke alle bisherigen Vergleichsmethoden. | Bild: Isomorphic Labs

IsoDDE kann zudem vorhersagen, wie stark ein Wirkstoff an sein Ziel bindet, und bisher unbekannte Andockstellen auf Proteinen finden, allein aus deren Bauplan. Das System soll in Sekunden Ergebnisse liefern, die fast so gut sind wie Laborexperimente. Das könnte neue Ansatzpunkte für Wirkstoffe sichtbar machen und die Vorauswahl am Computer deutlich beschleunigen.

Isomorphic Labs gibt an, IsoDDE bereits täglich in eigenen Forschungsprogrammen einzusetzen, mit dem Ziel, neue Wirkstoffe zu entwickeln. Details sind im technischen Bericht des Unternehmens verfügbar.

KI-Modelle erkennen oft nicht, was sie sehen

Ein neuer Härtetest für multimodale KI-Modelle offenbart fundamentale Schwächen: Der Benchmark „WorldVQA“ prüft, ob KI-Modelle visuelle Objekte tatsächlich erkennen. Selbst Spitzenreiter wie Gemini 3 Pro scheitern an der 50-Prozent-Marke und neigen zu massiver Selbstüberschätzung, wenn sie mit spezifischen Details statt generischen Begriffen konfrontiert werden.

Ein Modell, viele Stimmen: Reasoning-KI simuliert interne Expertenteams – und wird dadurch präziser

Wenn KI-Modelle nachdenken, streiten in ihrem Inneren verschiedene Stimmen miteinander: manche extravertiert, manche neurotisch, alle gewissenhaft. Forschende zeigen, dass dieses simulierte Teamwork die Leistung messbar verbessert.

Googles PaperBanana lässt fünf KI-Agenten wissenschaftliche Diagramme erstellen

KI-Agenten als Illustratoren: Forscher von Peking University und Google haben ein System entwickelt, das aus Methodenbeschreibungen automatisch Diagramme für wissenschaftliche Paper erzeugt. Fünf spezialisierte Agenten teilen sich dabei die Arbeit von der Recherche bis zur Qualitätskontrolle.