Anzeige
Skip to content
Read full article about: Alibabas Qwen3-Coder-Next ist ein effizientes KI-Modell für Programmier-Agenten

Alibaba hat mit Qwen3-Coder-Next ein neues Open-Weight-KI-Modell für Programmier-Agenten und lokale Entwicklung vorgestellt. Das Modell wurde mit 800 000 überprüfbaren Aufgaben in ausführbaren Umgebungen trainiert. Trotz seiner kompakten Größe von 80 Milliarden Parametern insgesamt und nur 3 Milliarden aktiven Parametern erreicht es starke Ergebnisse auf dem SWE-Bench Pro, einem Benchmark für Coding-Agenten.

Laut Alibaba übertrifft oder erreicht das Modell trotz seines kleinen aktiven Speicherbedarfs zudem mehrere deutlich größere Open-Source-Modelle bei verschiedenen Agenten-Tests. Auf dem SWE-Bench Verified erzielt es mehr als 70 Prozent mit dem SWE-Agent-Gerüst.

Das Modell unterstützt eine Kontextlänge von 256 000 Token und lässt sich in verschiedene Entwicklungsumgebungen wie Claude Code, Qwen Code, Qoder, Kilo, Trae und Cline integrieren. Für den lokalen Einsatz unterstützen Anwendungen wie Ollama, LMStudio, MLX-LM, llama.cpp und KTransformers das Modell.

Verfügbar ist es auf Hugging Face und ModelScope unter der Apache-2.0-Lizenz . Weitere Details finden sich im Blog und im technischen Bericht auf GitHub.

Read full article about: OpenAI besetzt Sicherheitsposten mit Anthropic-Mitarbeiter

OpenAI hat eine im Dezember ausgeschriebene Stelle für den "Leiter Vorbereitung" besetzt. CEO Sam Altman gab auf X bekannt, dass Dylan Scandinaro die Position übernimmt. Scandinaro war zuvor im KI-Sicherheitsteam des Konkurrenten Anthropic tätig.

Altman bezeichnete Scandinaro als "mit Abstand den besten Kandidaten", den er je für diese Rolle getroffen habe. Die Dinge würden sich bald sehr schnell bewegen und OpenAI werde mit "extrem leistungsstarken Modellen" arbeiten, was entsprechende Sicherheitsvorkehrungen erfordere.

Scandinaro selbst schrieb auf X, KI entwickle sich schnell, die möglichen Vorteile seien groß – ebenso die Risiken für "extreme und sogar unwiderrufliche Schäden". Es gebe viel zu tun und wenig Zeit dafür. OpenAI kündigte kürzlich an, dass ein neues Coding-Modell im Bereich Cybersecurity die Einstufung "hoch" erhält.

Anthropic gilt als besonders sicherheitsbewusster KI-Entwickler und wurde von ehemaligen OpenAI-Mitarbeitern gegründet, die unzufrieden waren mit OpenAIs starkem Produktfokus und angeblich zu geringen Sicherheitsmaßnahmen. Altman will laut eigenen Angaben mit Scandinaro zusammenarbeiten, um notwendige Änderungen im gesamten Unternehmen umzusetzen.

Read full article about: Anthropic will biologische Forschung mit KI-Agenten beschleunigen

Anthropic geht zwei Partnerschaften mit führenden US-Forschungseinrichtungen ein, um KI-Agenten für die biologische Forschung zu entwickeln. Das Allen Institute und das Howard Hughes Medical Institute (HHMI) werden als Gründungspartner mit dem KI-Unternehmen zusammenarbeiten. Laut Anthropic erzeugt die moderne biologische Forschung "Daten in einem noch nie dagewesenen Ausmaß", doch die Umwandlung in "validierte biologische Erkenntnisse bleibt ein grundlegender Engpass". Manuelle Prozesse könnten "nicht mit den produzierten Daten Schritt halten".

HHMI wird am Janelia Research Campus KI-Agenten entwickeln, die Wissen mit wissenschaftlichen Geräten und Analysepipelines verbinden. Das Allen Institute arbeitet an Multi-Agenten-Systemen für Datenintegration und Experimentdesign, die monatelange Analyse auf Stunden verkürzen könnten. Die KI soll menschliches Urteilsvermögen ergänzen, nicht ersetzen.

Anthropic baut sein Angebot für Wissenschaftler damit weiter aus. Mit Cowork bietet das Unternehmen seit Kurzem eine auf Büroarbeiten zugeschnittene Funktion, die Claude Zugriff auf lokale Dateien gibt. Auch OpenAI adressiert den Forschungsmarkt mit Prism, einem KI-Workspace für wissenschaftliches Schreiben.

Read full article about: Gemini-Modelle dominieren neue KI-Ranglisten für strategische Gesellschaftsspiele

Googles Gemini-Modelle schneiden in Gesellschaftsspielen am besten ab. Google Deepmind hat zusammen mit Kaggle die "Game Arena" um zwei neue Spiele erweitert: Werwolf und Poker. Die Plattform testet KI-Modelle in strategischen Spielen. Schach misst logisches Denken, Werwolf prüft soziale Fähigkeiten wie Kommunikation und das Erkennen von Täuschung, Poker testet den Umgang mit Risiko und unvollständigen Informationen.

Die Spiele lieferten objektive Messungen für Fähigkeiten wie Planung und Entscheidungen unter Unsicherheit. Gemini 3 Pro und Gemini 3 Flash belegen derzeit die ersten Plätze in allen Ranglisten. Die Werwolf-Benchmark dient auch der Sicherheitsforschung: Sie testet, ob Modelle Manipulation erkennen können, ohne reale Risiken einzugehen. Laut Google-Deepmind-CEO Demis Hassabis benötige die KI-Branche härtere Tests für die neuesten Modelle.

Read full article about: Französische Staatsanwaltschaft durchsucht X-Büros in Paris und lädt Elon Musk vor

Die französische Staatsanwaltschaft hat die Büros von Elon Musks Plattform X in Paris durchsucht. Die Cyberkriminalitätseinheit ermittelt wegen mehrerer Vorwürfe, darunter unrechtmäßige Datenextraktion und Beihilfe zur Verbreitung von Darstellungen von Kindesmissbrauch. Auch sexuelle Deepfakes sind Teil der Untersuchung. Musk und die frühere X-Chefin Linda Yaccarino wurden für April zu Anhörungen vorgeladen, berichtet die BBC. X hat die Ermittlungen zuvor als politisch motiviert bezeichnet.

Parallel dazu hat die britische Datenschutzbehörde ICO eine Untersuchung gegen Musks KI-Tool Grok eingeleitet. Es geht um die Frage, ob persönliche Daten ohne Zustimmung zur Erstellung sexualisierter Bilder verwendet wurden. Auch die britische Medienaufsicht Ofcom und die Europäische Kommission prüfen die Plattform weiterhin. X hat sich bisher nicht zu den Ermittlungen geäußert.

Read full article about: Firefox-Nutzer können bald alle generativen KI-Funktionen zentral blockieren

Mozilla führt mit Firefox 148 am 24. Februar neue KI-Einstellungen ein. Nutzer können damit alle generativen KI-Funktionen des Browsers an einem Ort verwalten oder komplett blockieren, schreibt Mozilla im Unternehmensblog.

Die neuen Einstellungen umfassen Übersetzungen, automatische Bildbeschreibungen in PDFs, KI-gestützte Tab-Gruppierung, Link-Vorschauen sowie einen Chatbot in der Seitenleiste. Für den Chatbot stehen Dienste wie Anthropic Claude, ChatGPT, Microsoft Copilot, Google Gemini und Le Chat Mistral zur Auswahl.

Wer keine KI-Funktionen nutzen möchte, kann mit einem Schalter alle KI-Erweiterungen blockieren. Dann erscheinen auch keine Pop-ups oder Hinweise zu bestehenden oder künftigen KI-Features. Die gewählten Einstellungen bleiben bei Updates erhalten. Wer die Funktion früher testen möchte, findet sie in Firefox Nightly.

Read full article about: OpenAI startet Codex-App für macOS zur Verwaltung mehrerer KI-Agenten

OpenAI hat die Codex-App für macOS vorgestellt. Die App ermöglicht es Entwicklern, mehrere KI-Agenten gleichzeitig zu steuern und Aufgaben parallel abzuarbeiten. Laut OpenAI ist Codex einfacher zu bedienen als ein Terminal und richtet sich damit an eine breitere Gruppe von Entwicklern.

Mit der App können Nutzer mehrere Agenten asynchron über verschiedene Projekte hinweg steuern, wiederkehrende Aufgaben mit sogenannten Automations planen und delegieren sowie über Skills Agenten mit externen Werkzeugen und Arbeitsabläufen verbinden. Zudem lässt sich die Arbeit der Agenten überprüfen und korrigieren, ohne den Kontext zu verlieren.

Die Codex-App (Download) ist für alle ChatGPT Plus-, Pro-, Business-, Enterprise- und Edu-Konten verfügbar. Für begrenzte Zeit können auch Nutzer von ChatGPT Free und Go die App testen – das untermauert, dass OpenAI hier Zielgruppen über Entwickler hinaus im Blick hat. Zudem verdoppelt OpenAI die Nutzungslimits für alle bezahlten Tarife. Die App funktioniert nahtlos mit dem CLI, der IDE-Erweiterung und der Cloud über ein einziges ChatGPT-Konto.

Read full article about: KI-Boom treibt Speicherpreise: Apple drohen bis zu 57 Dollar Mehrkosten pro iPhone

Der KI-Boom könnte Apple bis zu 57 Dollar mehr pro iPhone kosten – allein für Speicherchips. "Die Steigerungsrate beim Preis von Speicher ist beispiellos", sagt Mike Howard, Analyst bei TechInsights, gegenüber dem Wall Street Journal. Bis Ende des Jahres werde sich der Preis für DRAM-Speicher im Vergleich zu 2023 vervierfachen, NAND-Speicher mehr als verdreifachen.

Für Apple bedeutet das konkret: Das Basis-iPhone 18 könnte im Herbst 57 Dollar mehr an Speicherkosten verursachen als das aktuelle iPhone 17. Das ist bei einem Verkaufspreis von 799 Dollar ein erheblicher Schlag für die Gewinnmargen. Dazu passen auch die Gerüchte der letzten Tage, dass das Unternehmen dieses Jahr die Basis-Version auf einen späteren Release verschieben könnte.

Die Ursache: KI-Unternehmen wie OpenAI, Google und Meta zahlen hohe Summen und setzen sich zunehmend gegen Apple im Rennen um knappe Komponenten durch. Dazu hat Nvidia Apple mittlerweile als größten Kunden von TSMC abgelöst, Apple hielt diese Position davor jahrelang inne.

Read full article about: Ex-OpenAI-Forscher: Aktuelle KI-Modelle können keine echte Intelligenz erreichen

Jerry Tworek, ehemaliger VP of Research bei OpenAI, sieht ein grundlegendes Problem bei aktuellen KI-Modellen: Sie können nicht aus Fehlern lernen. "Wenn ein Modell scheitert, steht man ziemlich schnell hilflos da", sagt Tworek im Podcast Unsupervised Learning. Es gebe keinen guten Weg für ein Modell, sein Wissen nach einem Misserfolg zu aktualisieren.

Der Forscher, der an OpenAIs Reasoning-Modellen wie o1 und o3 mitarbeitete, hat OpenAI kürzlich verlassen, um dieses Problem zu lösen. Seine AGI-Prognosen hat er nach oben korrigiert. "Solange Modelle bei Problemen steckenbleiben, würde ich es nicht AGI nennen", erklärt er. KI-Training sei ein "fragiler Prozess". Menschliches Lernen sei dagegen robust und könne sich selbst stabilisieren. Intelligenz finde immer einen Weg, so Tworek.

Apple-Forscher zeigten kürzlich, dass auch Reasoning-Modelle bei schwierigen Problemen wie den "Türmen von Hanoi" einen "Reasoning-Kollaps" erleiden können. Auch andere Paper beschreiben diese Fragilität, auf die sich Tworek hier bezieht.

Read full article about: Chinas KI-Labore liefern sich Wettlauf vor dem Neujahrsfest

Chinas KI-Labore liefern sich vor dem chinesischen Neujahrsfest einen Wettlauf um neue Modellveröffentlichungen. Zhipu AI und Minimax, die beide kürzlich an der Hongkonger Börse debütierten, wollen laut South China Morning Post in den nächsten zwei Wochen ihre Flaggschiff-Modelle aktualisieren. Zhipu AI plant nach GLM-4.7 offenbar GLM-5 mit Verbesserungen bei kreativem Schreiben, Programmieren und logischem Denken; Minimax bereitet parallel dazu M2.2 mit Fokus auf Programmier-Funktionen vor. Im Jahr 2025 haben chinesische Unternehmen die Dominanz großer US-Firmen zunehmend in Frage gestellt.

Alibaba, Moonshot AI und Baidu haben zuletzt mit ihren leistungsstärksten Modellen Qwen3-Max-Thinking, Kimi K2.5 und Ernie 5.0 vorgelegt. Deepseek plant dieses Jahr laut einer Quelle aber nur ein kleineres Update: Das nächste große Modell des Unternehmens soll ein Billionen-Parameter-Modell werden, dessen Training sich wegen der wachsenden Größe anscheinend verzögert. Tencent, Baidu und Alibaba investieren derweil Milliarden Yuan in Werbekampagnen für ihre schon jetzt sehr beliebten KI-Chatbots während der Feiertage.