Das in Paris ansässige KI-Start-up Mistral AI hat in einer Finanzierungsrunde unter der Leitung der Silicon Valley Venture-Capital-Gesellschaft Andreessen Horowitz und des Erstinvestors Lightspeed Ventures 385 Millionen Euro eingesammelt.
Das erst sieben Monate alte Unternehmen mit derzeit 22 Angestellten, das von ehemaligen Deepmind-Forschern von Alphabet Inc. und Meta Platforms Inc. gegründet wurde, wird derzeit mit rund zwei Milliarden US-Dollar bewertet. Es veröffentlicht außerdem ein neues Open-Source-Modell und bietet Zugang zu seiner API-Plattform.
Open-Source-Software für Chatbots und generative KI-Tools
Mistral AI entwickelt Open-Source-Modelle, die Chatbots und andere generative KI-Tools antreiben. Ähnlich wie Meta mit Llama sieht der Businessplan von Mistral vor, zunächst eine möglichst hohe Marktdurchdringung mit den eigenen Open-Source-Modellen zu erreichen, um dann Premium-Dienste rund um diese Modelle anzubieten oder besonders hochwertige Modelle kostenpflichtig zu machen.
Weitere Investoren in dieser Runde sind Salesforce Inc, BNP Paribas, CMA CGM, General Catalyst, Elad Gil, Emerson Collective, Conviction, Bpifrance, La Famiglia, Eric Schmidt, New Wave, Motier Ventures und Sofina.
Mit dem leistungsfähigen Mistral 7B hat Mistral im September ein erstes Mini-Sprachmodell veröffentlicht, das sich schnell in der Open-Source-Szene etabliert hat. Mit Mixtral MoE hat Mistral nun ein Mixture-of-Experts-Modell veröffentlicht, das der vermuteten GPT-4-Architektur folgt.
Es vernetzt acht 7B-Modelle und soll in Benchmarks GPT-3.5 und Llama 2 mit 70B übertreffen. Das Kontextfenster ist 32k groß und unterstützt neben Englisch auch Französisch, Italienisch, Deutsch und Spanisch.
Mistral startet API-Zugang
Mistral AI hat den Beta-Zugang zu seinen ersten Plattformdiensten gestartet, darunter drei Chat-Endpoints zur Texterstellung und ein Einbettungs-Endpoint. Die Endpunkte mit den Bezeichnungen mistral-tiny, mistral-small (Mixtral MoE) und mistral-medium nutzen unterschiedliche KI-Modelle, wobei der mittlere Endpunkt ein leistungsfähigeres Prototyp-Modell verwendet, das im MMLU rund 75 Prozent erreicht und GPT-3.5 deutlich übertreffen soll.
Die Plattform bietet Anpassungstechniken wie Feintuning und direkte Präferenzoptimierung für einfach zu steuernde Modelle. Mistral-tiny arbeitet auf Englisch, während mistral-small und mistral-medium mehrere Sprachen und Codes unterstützen.
Die Plattform umfasst auch ein Einbettungsmodell, mistral-embed, das für Retrievalzwecke entwickelt wurde. Die APIs entsprechen den gängigen Spezifikationen für Chat-Schnittstellen.
Die Kapazität der Plattform wird mit dem Übergang vom Beta-Zugang zur allgemeinen Verfügbarkeit 2024 schrittweise erhöht. Nvidia hat Mistral AI bei der Integration von TRT-LLM und Triton unterstützt.
Europa legt bei KI nach
Das deutsche KI-Unternehmen Aleph Alpha hat in einer Serie-B-Finanzierungsrunde mehr als 500 Millionen US-Dollar von einem Konsortium aus sieben neuen und bestehenden Investoren erhalten.
Die Finanzierung soll Aleph Alpha helfen, seine Position als Anbieter von generativen KI-Anwendungen in Europa zu stärken und die Produktentwicklung und -skalierung zu beschleunigen.
Aleph Alpha konzentriert sich auf erklärbare und vertrauenswürdige Ansätze für generative KI und betreibt nach eigenen Angaben das schnellste kommerzielle KI-Rechenzentrum Europas.
Mistral AI und Aleph Alpha sind derzeit wohl die stärksten Anbieter von generativen KI-Modellen in Europa, die internationale Wettbewerber wie Meta, Anthropic und OpenAI herausfordern wollen.
Doch trotz der jüngsten Investitionen in Millionenhöhe besteht im Vergleich zu den USA weiterhin ein Ungleichgewicht in der Finanzierung: OpenAI hat allein von Microsoft mehr als zehn Milliarden US-Dollar erhalten, Anthropic wird von Google und Amazon mit bis zu sechs Milliarden US-Dollar unterstützt.