Die Open-Source-Initiative (OSI) legt erstmals fest, wann KI-Systeme als Open Source gelten dürfen. Metas Llama-Modelle erfüllen diese Kriterien nicht, obwohl sich Meta im KI-Kontext immer wieder als Vorzeige-Open-Source-Unternehmen positioniert.
Die Open-Source-Initiative (OSI) hat auf der All Things Open 2024 Konferenz ihre erste Definition für Open-Source-KI (OSAID) vorgestellt. Nach Angaben der OSI ist die Definition das Ergebnis eines einjährigen globalen Gestaltungsprozesses und mehrjähriger Forschungsarbeit.
Die neue Definition stellt klare Anforderungen: Open-Source-KI-Modelle müssen demnach ausreichend Informationen über ihre Trainingsdaten bereitstellen, damit ein "qualifizierter Mensch ein im Wesentlichen gleichwertiges System mit denselben oder ähnlichen Daten nachbilden kann", wie die OSI mitteilt.
Diese Anforderungen würden weit über das hinausgehen, was viele proprietäre oder vermeintlich offene Modelle derzeit bieten, sagte Ayah Bdeir, der die KI-Strategie bei Mozilla leitet.
Im Wesentlichen beschreibt die Open-Source-Definition für KI die Freiheiten, die ein Open-Source-KI-System gewähren muss.
Dazu gehören die Nutzung für beliebige Zwecke, die Möglichkeit, die Funktionsweise des Systems zu untersuchen, es zu modifizieren und mit anderen zu teilen. Voraussetzung dafür ist, dass Informationen über die Trainingsdaten, der vollständige Quellcode und die Modellparameter in einer Form verfügbar sind, die Änderungen erlaubt.
Die Definition gilt sowohl für komplette Systeme als auch für einzelne Komponenten wie Modelle und Gewichte. Ziel sei es, die Vorteile von Open Source wie Autonomie, Transparenz und kollaborative Verbesserung auch für KI-Systeme zu ermöglichen.
Metas Llama-Modelle erfüllen Open-Source-Kriterien nicht
Mit der neuen Definition bekräftigt die OSI ihre Kritik an Meta. Der Technologiekonzern bezeichnet seine Llama-Modelle als Open Source und inszeniert sich als großer Förderer offener KI, obwohl die Lizenz nach Ansicht der OSI nicht den Open-Source-Kriterien entspricht.
Meta veröffentlicht zwar die Modellgewichte von Llama, hält aber die Trainingsdaten zurück. Außerdem schränkt die Llama-Lizenz die kommerzielle Nutzung und bestimmte Anwendungsbereiche ein - ein klarer Verstoß gegen die Open-Source-Prinzipien der OSI.
Meta verteidigt seinen Ansatz mit dem Argument, dass die hohen Kosten und die Komplexität der LLM-Entwicklung ein "Spektrum an Offenheit" erforderten. Kritiker vermuten hingegen, dass Meta versucht, regulatorische Schlupflöcher auszunutzen, da der EU-AI-Act Ausnahmen für Open-Source-Modelle bietet.