Forscher haben mit Hilfe Künstlicher Intelligenz neue Erkenntnisse aus bereits veröffentlichten wissenschaftlichen Arbeiten gewonnen. Möglich ist das mit komplexer Wort-Statistik.
Forscher konnten mit einer auf Sprachverarbeitung spezialisierten Künstlichen Intelligenz aus alten Veröffentlichungen neue Erkenntnisse gewinnen.
Die KI gab unter anderem Hinweise auf Materialien, die Hitze in Energie umwandeln und etwa zum Kühlen eingesetzt werden können – obwohl sie kein Vorwissen in den Materialwissenschaften hatte.
Wie eine Wortlandkarte
Möglich war diese Entdeckung durch Word2vec, einem KI-Algorithmus, der häufig für Übersetzungen eingesetzt wird.
Word2vec ordnet Wörtern in einem Koordinatensystem einen fixen Punkt zu. Wörter, die häufig in gleichen Kontexten auftauchen, erhalten ähnliche Punkte.
So entsteht eine Landkarte zusammengehöriger Begriffe. Zum Beispiel stehen etwa Ländernamen dicht zusammen oder Begriffe wie „gut“, „schlecht“ und „böse“. Für diese Sortierung muss die KI kein Verständnis für den eigentlichen Inhalt haben – es ist reine Statistik.
KI-Vorhersagen
Die Forscher trainierten ihre KI mit 3,3 Millionen Zusammenfassungen wissenschaftlicher Veröffentlichungen aus den Materialwissenschaften. Die KI füllte die Wortlandkarte so mit Begriffen der Thermoelektrik, von chemischen Molekülen oder aus dem Periodensystem.
Nach dem Training hatte die KI den thermoelektrischen Begriffen Wörter zugeordnet, die noch nie in diesem direkten Zusammenhang aufgetaucht waren – darunter mögliche Kandidaten für noch unentdeckte Materialien.
KI erkennt bekanntes Material vier Jahre früher
Doch sind diese Vorhersagen überhaupt vielversprechend? Kann die KI wissenschaftliche Entdeckungen machen?
Um den Nutzen der KI-Auswertung zu überprüfen, trainierten die Forscher sie nur mit Aufsätzen vor 2009. Anschließend verglichen sie die Voraussagen der KI mit der technischen Entwicklung der letzten zehn Jahre.
Das Ergebnis: Die besten fünf Empfehlungen der KI enthielten vier vielversprechende Materialien. Darunter eines der modernsten thermoelektrischen Materialien (CuGaTe2) – vier Jahre vor der ersten wissenschaftlichen Veröffentlichung in 2012. Zwei weitere Materialien wurden erst etwa neun Jahre später als thermoelektrisch identifiziert.
Nicht nur auf Materialien beschränkt
Word2vec setzt derzeit auf ein zweischichtiges neuronales Netz. Die Forscher versprechen sich von mehr Schichten noch bessere Ergebnisse und wollen ihre KI daher aufrüsten.
Dafür wollen sie unter anderem die mehrschichtige Sprach-KI „ELMo“ einsetzen, die letztes Jahr für einen großen Durchbruch in der Sprachverarbeitung sorgte.
Die neue KI-Analysemethode könnte in Zukunft außerhalb der Materialwissenschaften zum Einsatz kommen. Die gigantische Anzahl wissenschaftlicher Veröffentlichung könnte so besser nach bisher unbekannten Zusammenhängen durchsucht werden, beispielsweise für neue Medikamente.