Anzeige
Skip to content

Tech-Konzerne nehmen für KI-Ausbau Rekordschulden auf

Technologiekonzerne wie Google, Meta, Microsoft und Amazon geben aktuell enorme Summen für den Ausbau ihrer KI-Infrastruktur aus. Die Bank of England warnt: „Das ist ein sich schnell entwickelndes Thema, und die Zukunft ist äußerst ungewiss“, schrieb die Bank Ende Oktober.

Read full article about: Der „Charakter“ von GPT-4o kommt nicht zurück, weil er zufällig entstanden ist

Ein als "Roon" auf X bekannter OpenAI-Entwickler erklärt, warum der "Charakter" eines LLMs nicht reproduzierbar ist. Laut Roon (via JB) kann sich die Persönlichkeit eines Modells bei jedem Trainingslauf verändern, selbst wenn die Daten identisch bleiben. Grund dafür sind zufällige Faktoren im Trainingsprozess, etwa beim Reinforcement Learning (RL), die zu leicht abweichenden Ergebnissen führen. Diese Unterschiede entstehen durch zufällige Entscheidungen im sogenannten Modellraum.

OpenAI versuche laut Roon, diese sogenannten "Personality Drifts" möglichst gering zu halten, da Nutzer oft eine emotionale Bindung zu bestimmten Modellen entwickeln; so geschehen beim "Speichellecker"-Modell GPT-4o, das einige Menschen vermissen (Roon nicht; er wünschte dem Modell mangels Alignment „den Tod” und löschte den Tweet später). Dennoch sei es selbst innerhalb eines Trainingslaufs schwierig, exakt dieselbe Persönlichkeit wiederherzustellen.

Studie deckt massive Schwächen in KI-Benchmarks auf

Ein internationales Forschungsteam hat die Validität von Large-Language-Model-Benchmarks systematisch untersucht und dabei erhebliche Mängel aufgedeckt. Die Analyse von 445 Benchmark-Artikeln aus führenden KI-Konferenzen zeigt, dass fast alle Bewertungsverfahren fundamentale methodische Schwächen aufweisen.

Anzeige
Read full article about: Anthropic kommt nach Paris und München

Anthropic eröffnet neue Büros in Paris und München, um seine Präsenz in Europa auszubauen. Die Standorte ergänzen bestehende Niederlassungen in London, Dublin und Zürich. Laut Anthropic ist die EMEA-Region derzeit der am schnellsten wachsende Markt, mit einem mehr als verneunfachten Umsatz im letzten Jahr. Das Unternehmen baut für Europa ein eigenes Führungsteam auf, unter anderem mit Pip White für Nordeuropa und Thomas Remy für Südeuropa. Die neuen Büros sollen auch als regionale Zentren für Vertrieb, Partnerschaften und politische Zusammenarbeit dienen.

Mit Paris und München zählt Anthropic nun weltweit zwölf Standorte. Laut der Firma nutzen EU-Kunden wie BMW, SAP, Sanofi und Doctolib das KI-Modell Claude für Aufgaben wie Softwareentwicklung und Netzwerkmanagement. Begleitend kooperiert Anthropic mit Organisationen wie TUM.ai und Unaite.

OpenAI und die KI-Blase: Kritik an CEO Sam Altman wird lauter

OpenAI plant Recheninfrastruktur im Billionenbereich, bei bislang „nur“ rund 20 Milliarden US‑Dollar Jahresumsatz. Diese Diskrepanz und die Forderung nach staatlicher Beteiligung an der KI‑Infrastruktur sorgen nun für Kontroversen. Im Zentrum der Debatte: CEO Sam Altman.

Anzeige
Read full article about: Gemini-KI mit eigenen Daten: Google veröffentlicht "File Search Tool"

Google hat das File Search Tool in die Gemini-API integriert. Damit können Entwicklerinnen und Entwickler eigene Dateien über eine Vektordatenbank anbinden, um Gemini-Antworten auf konkrete Inhalte zu beziehen. Das Tool übernimmt dabei die Speicherung, Dateiaufteilung, Vektorsuche und das Einfügen der gefundenen Inhalte in eine Anfrage.

Die Nutzung ist kostenlos, abgerechnet wird nur die erste Indexierung der Daten (0,15 US-Dollar pro eine Million Tokens). Unterstützt werden Formate wie PDF, DOCX, TXT und JSON. Die Antworten enthalten automatisch Quellenverweise. Laut Google wird das Tool unter anderem für interne Suchsysteme und Chatbots eingesetzt. Dokumentation und eine Demoversion sind im Google-AI-Studio verfügbar.

Moonshot AI stellt Kimi K2 Thinking als "bestes Open-Source-Thinking-Modell" vor

Das chinesische KI-Unternehmen Moonshot AI hat mit Kimi K2 Thinking ein neues Open-Source-Sprachmodell vorgestellt, das nach eigenen Angaben das „beste Open-Source-Thinking-Modell“ sein soll. Beeindruckend ist eine Demo, bei der das Modell aus nur einem Prompt einen Word-Klon erzeugt.

Anzeige