Anzeige
Skip to content

German Commons: Forschende veröffentlichen größten offen lizenzierten deutschen Textkorpus

Ein Forschungsteam hat mit German Commons die bisher umfangreichste Sammlung explizit offen lizenzierter deutscher Texte zusammengestellt. Der Korpus soll die Entwicklung rechtlich unbedenklicher deutscher Sprachmodelle ermöglichen.

Read full article about: xAI ersetzt Klickarbeit durch Fachkräfte: 500 Entlassungen bei Musks KI-Team

Elon Musks KI-Firma xAI hat rund 500 Beschäftigte entlassen, ein Drittel des Teams für Datenannotation. Diese Mitarbeiter hatten bisher den Chatbot Grok trainiert, indem sie Rohdaten einordneten und erklärten. Laut internen E-Mails, die Business Insider einsehen konnte, beendet xAI damit die meisten Stellen für sogenannte Generalisten-Tutoren und will stattdessen Fachkräfte ausbauen. Angestellte werden bis Ende ihres Vertrags oder spätestens bis 30. November bezahlt, verloren jedoch sofort den Zugang zu den Systemen. Kurz vor den Kündigungen mussten Beschäftigte Tests zu ihren Fähigkeiten absolvieren, die künftig über ihre Rollen entscheiden sollten. Auf X kündigte xAI an, das Team der Fach-Tutoren, etwa in Naturwissenschaften, Medizin oder Finanzen, „zehnfach“ zu vergrößern. Diese sollen Grok tieferes Fachwissen vermitteln, ähnlich wie es inzwischen auch andere KI-Unternehmen handhaben, oft über externe Dienstleister. Billige Massenarbeit bei der Datenannotation verliert damit mehr und mehr an Bedeutung – sie hat sich in vielen Bereichen durch die leistungsstarken KI-Systeme, die sie mit aufgebaut hat, selbst abgeschafft.

Read full article about: US-Autoren verklagen Apple wegen KI-Training mit illegalen Buchkopien

Apple wird in Kalifornien von den US-Autor:innen Grady Hendrix und Jennifer Roberson wegen Urheberrechtsverletzung verklagt. Die Klage wirft Apple vor, Bücher ohne Zustimmung genutzt zu haben, um KI-Modelle wie OpenELM und Apple Intelligence zu trainieren. Konkret soll Apple das als Raubkopie bekannte Books3-Datenset verwendet haben, das über 196.000 Bücher enthält – darunter die Werke der Kläger. Apple soll zudem Webseiten über Applebot kopiert und Inhalte aus sogenannten Schattenbibliotheken bezogen haben.

Die Kläger fordern Schadenersatz und ein Verbot der Nutzung ihrer Werke. Die Sammelklage folgt ähnlichen Vorwürfen gegen andere KI-Firmen wie Anthropic, die sich außergerichtlich mit den Klägern geeinigt hat, da die Autoren gute Aussichten hatten, den Rechtsstreit zu gewinnen.

Read full article about: Ende der Billigarbeit: KI-Firmen setzen auf teure Experten für Trainingsdaten

„Das Modell wird nicht nur besser sein als ein Physiker. Es wird besser sein als eine Superposition von jemandem, der in Physik, Informatik und Datenwissenschaft zur Weltspitze gehört.“

Mit diesem Satz beschreibt Jonathan Siddharth, CEO von Turing AI, den Paradigmenwechsel im Training fortgeschrittener KI-Modelle: Statt auf günstige Clickworker zu setzen, investieren Unternehmen wie Scale AI, Toloka und Turing nun gezielt in hochqualifizierte Fachkräfte aus Physik, Biologie, Softwareentwicklung und Finanzwesen. Ziel ist es, komplexe, domänenspezifische Aufgaben zu generieren, die echte menschliche Denkprozesse abbilden – etwa durch das Schreiben von Code, das Validieren physikalischer Theorien oder das Analysieren von Simulationen. Diese Daten dienen dann für das Training der neuen Reasoning-Modelle großer Unternehmen wie OpenAI.