IBM bietet KI-Modelle und Datensätze kostenlos für jedermann an. Das Unternehmen verspricht eine hohe Qualität.
Das 1911 gegründete IT-Unternehmen IBM hat eine lange Tradition bei der Entwicklung Künstlicher Intelligenz: Es war IBMs Deep-Blue-Schachcomputer, der mit seinem Sieg 1997 gegen den damaligen Weltmeister Garri Kasparow Künstliche Intelligenz bei vielen Menschen bekannt machte. Lange galt dieser Sieg als Triumph der Maschine über den Menschen: der Anfang des Durchbruchs Künstlicher Intelligenz.
Heute machen vor allem Google, Microsoft und Facebook KI-Schlagzeilen. Doch IBM ist weiter vorne dabei: Die Watson-KI gewann 2011 die Quizsendung Jeopardy, die Debattier-KI Debater schlug sich Anfang des Jahres erstaunlich gut gegen ihre menschlichen Gegner. Und in einer Studie der Weltorganisation für geistiges Eigentum lag IBM mit etwas über 8.000 neu angemeldeten KI-Patenten auf Platz eins.
Mittlerweile ist Watson mehr als ein Quizcomputer: Das künstliche Gehirn wanderte in die Cloud, in der Kunden eigene KI-Modelle bauen oder vorgefertigte laufen lassen können. Auf Watson basierte KIs geben Behandlungsempfehlungen in der Medizin oder berechnen die Leistungsfähigkeit von Mitarbeitern.
Kostenlose KIs und Datensätze
Nun hat IBMs Zentrum für Open Source Daten- und KI-Technologien (CODAIT) eine Reihe von vorgefertigten KI-Modellen und Datensätzen fürs KI-Training vorgestellt. Solche standen bisher nur Watson-Kunden zur Verfügung. IBM beschreibt in einer kurzen Anleitung, wie ihr die kostenlosen Modelle und Daten nutzen könnt.
Alle KI-Modelle finden sich im "Model Assets Exchange" (MAX), alle Datensätze im "Data Assets Exchange" (DAX). Wer also kein passendes KI-Modell findet, kann auch nur mit den Datensätzen eine eigene KI trainieren, die nicht von IBM kommt.
Aktuell finden sich 28 KI-Modelle und acht Datensätze auf IBMs Webseite. Darunter befinden sich etwa KIs zur Bildbearbeitung, Emotionserkennung oder ein Sprach-zu-Text-Wandler.
Die Datensätze entstammen internen Forschungsprojekten und sind daher recht speziell: Sie umfassen etwa Wetterdaten oder 21 Videos eines schwingenden Doppelpendels.
Weitere Datensätze in Planung
Etwa 24 weitere Datensätze seien in Planung, sagt Fred Reiss, Chefarchitekt bei CODAIT, gegenüber The Next Web. In Zukunft sollen externe Entwickler eigene Datensätze hochladen können, sofern sie IBMs Qualitätsvorgaben entsprechen.
Alle Datensätze durchlaufen einen aufwendigen Prüfungsprozess. So soll deren Qualität sichergestellt werden und eventuelle Datenschutzprobleme sollen verhindert werden.
IBM stand Anfang des Jahres in der Kritik, veröffentlichte Datensätze nicht ausreichend zu prüfen. Ein Datensatz für Gesichtserkennung enthielt Fotos, deren Urheber nichts von ihrer Beteiligung am KI-Training wussten.
Quelle: IBM, The Next Web