Titelbild: Samasource
Ein kalifornisches Unternehmen lässt Trainingsdaten für Künstliche Intelligenz in einem Slum in Kenia vorbereiten.
Künstliche Intelligenz braucht Daten. Häufig müssen diese Daten vor der maschinellen Verwertung händisch aufbereitet werden.
Eine KI, die Autos erkennen soll, muss beispielsweise mit Tausenden Bildern trainiert werden, auf denen ein Auto zu sehen ist. Zusätzlich muss das Bild mit dem Wort „Auto“ beschriftet sein. Nur so kann eine Künstliche Intelligenz die Verbindung zwischen Bild und Wort herstellen. Je größer der Datensatz, desto effektiver ist das Training.
Diese mühsame Vorbereitung riesiger Datensätze fällt in nahezu allen KI-Projekten an. Die KI-Maschine, die die Menschheit eigentlich von repetitiven Aufgaben befreien soll, kann sie (noch) nicht selbst erledigen. Das könnte sie nur, wenn sie schon trainiert wäre. Dafür bräuchte sie wiederum Daten. Eine Sackgasse.
Bilder vorbereiten für neun Dollar pro Tag
Der Dienstleister Samasource aus San Francisco nimmt seinen Kunden die mühsame Datenvorbereitung ab. Zum Kundenkreis gehören unter anderem Google und Microsoft.
Samasource wurde bereits 2008 von Hauptgeschäftsführerin Leila Janah gegründet. Ihre Idee: die mühselige und teure Arbeit in Entwicklungsländer outsourcen.
„Sehr kluge Leute der Techbranche und große Philanthropen sagten, dass das Outsourcing eine wunderbare Idee sei, aber dass es nie funktionieren würde“, sagt Janah. Techunternehmen hätten Bedenken gehabt, dass die Menschen in Entwicklungsländern nicht über das notwendige IT-Wissen verfügten, um qualitative Standards einzuhalten.
Heute führt Janah die größte Datenvorbereiter-Firma in Ostafrika. Samasource hat außerdem Standorte in Asien und Nordamerika.
In Nairobi arbeiten über 1.000 Menschen für Samasource, etwa drei Viertel stammen aus den umliegenden Slums, mehr als die Hälfte sind Frauen. Samasource bildet die Datenvorbereiter vor Ort in einer eigenen Schule aus.
Samasource zahlt den Datenvorbereitern etwa neun US-Dollar pro Tag. Damit gehören sie zu den Besserverdienern in ihrer Gegend. Viele Bewohner des Slums erhalten oft nur zwei US-Dollar am Tag und das bei mitunter schlechteren oder gar gefährlichen Arbeitsbedingungen.
Auf Kritik an der im Vergleich zu den Gewinnen der Auftraggeber geringen Löhne reagiert Samasource mit Verweis auf die ökonomische Balance im Slum: Höhere Löhne würden das lokale finanzielle Gleichgewicht durcheinanderbringen und so mehr Schaden anrichten, als Nutzen stiften.
KI-Training ohne Daten ist in Entwicklung
Doch wie lange werden die Datenvorbereiter noch gebraucht? Längst wird an Algorithmen geforscht, die mit wenig oder gar ohne vorbereitete Daten auskommen oder die Daten eigenständig vorbereiten.
„Das ist die Milliarden-Dollar-Frage“, sagt Janah. „Ich denke, da gibt es eine Menge Hype. Aber wenn man tatsächlich mit Datenwissenschaftlern spricht, wird man feststellen, dass die Maschine viel weiter zurückliegt, als die meisten Leute glauben.“
Janah ist überzeugt: „Menschen werden noch für lange Zeit Trainingsdaten für Künstliche Intelligenz vorbereiten müssen.“
Via: BBC