Ein internationales Forschungsteam hat Polymathic AI ins Leben gerufen. Das Team entwickelt eine künstliche Intelligenz, die aus Daten und Simulationen aus verschiedenen wissenschaftlichen Bereichen lernt, um neue Erkenntnisse zu gewinnen.
Die Initiative Polymathic AI zielt darauf ab, die Entwicklung vielseitiger Basismodelle für Anwendungen des maschinellen Lernens in der Wissenschaft zu beschleunigen. Sie soll die Vorteile von Basismodellen (Foundation Model), die bisher vor allem in der Bildverarbeitung und der Sprachverarbeitung eingesetzt werden, in die Welt des wissenschaftlichen maschinellen Lernens bringen.
Das Team hinter Polymathic AI besteht aus Experten verschiedener Institutionen und Disziplinen. Dazu gehören die Simons Foundation und das Flatiron Institute, die New York University, die University of Cambridge, die Princeton University und das Lawrence Berkeley National Laboratory. Die beteiligten Fachleute sind Spezialisten in den Bereichen Physik, Astrophysik, Mathematik, künstliche Intelligenz und Neurowissenschaften.
Die Initiative wurde parallel zur Veröffentlichung entsprechender wissenschaftlicher Arbeiten auf arXiv.org, einem Open-Access-Repositorium, bekannt gegeben.
Foundation Modell für die Wissenschaft
Laut Shirley Ho, Projektleiterin und Gruppenleiterin am Flatiron Institute's Center for Computational Astrophysics in New York, wird das Projekt "die Art und Weise, wie Menschen KI und maschinelles Lernen in der Wissenschaft einsetzen, völlig verändern".
Die Idee dahinter: Ein bereits vortrainiertes Modell, auch Foundation-Modell genannt, kann schneller und genauer sein als der Aufbau eines wissenschaftlichen Modells von Grund auf. Das gelte selbst dann, wenn die Trainingsdaten für das Problem nicht direkt relevant sind.
Die Herausforderung besteht darin, KI-Modelle zu erstellen, die Informationen aus heterogenen Datensätzen und verschiedenen wissenschaftlichen Bereichen nutzen können. Im Gegensatz zu Bereichen wie der Sprachverarbeitung gibt es hier keine einheitliche Repräsentation wie Text.
Polymathic AI behandelt daher Zahlen als reale Zahlen und nicht als Zeichen wie Buchstaben und Satzzeichen. Als Trainingsdaten werden reale wissenschaftliche Datensätze verwendet, die die zugrunde liegende Physik des Kosmos erfassen.
Das KI-Modell soll aus numerischen Daten und physikalischen Simulationen in verschiedenen wissenschaftlichen Bereichen lernen und dabei helfen, Phänomene wie Riesensterne und das Erdklima zu modellieren.
Die im Rahmen dieser Initiative entwickelten Modelle können dann als Ausgangspunkt dienen und von Wissenschaftlern für spezifische Anwendungen verfeinert werden.
Interdisziplinäre Forschung mit Polymathic AI
Eines der Hauptprobleme bei der akademischen Arbeit mit Foundation-Modellen sei der Rechenaufwand, erklärt Miles Cranmer, Mitinitiator des Projekts und Mitarbeiter der Abteilung für angewandte Mathematik und theoretische Physik sowie des Instituts für Astronomie an der Universität Cambridge. Die Zusammenarbeit mit der Simons Foundation biete jedoch die notwendigen Ressourcen, um solche Modelle für die wissenschaftliche Forschung zu testen.
Mitinitiator Siavash Golkar, Gastwissenschaftler am Center for Computational Astrophysics des Flatiron Institute, sieht in Polymathic AI ein Werkzeug, das Wissenschaftlern hilft, Verbindungen zwischen verschiedenen Disziplinen zu entdecken. Die KI soll Daten aus verschiedenen Disziplinen zusammenführen und so die Herausforderung bewältigen, in mehreren Disziplinen auf dem neuesten Stand zu bleiben.
François Lanusse, Mitinitiator und Kosmologe am Centre national de la recherche scientifique (CNRS) in Frankreich, betont, dass Polymathic AI im Gegensatz zu bestehenden KI-Tools nicht auf bestimmte Anwendungsfälle und Daten beschränkt sei. Stattdessen werde es Daten aus verschiedenen Quellen und Bereichen nutzen und sein multidisziplinäres Wissen auf eine Vielzahl wissenschaftlicher Probleme anwenden.
Shirley Ho unterstreicht die Bedeutung von Transparenz und Offenheit im Polymathic AI-Projekt: Ziel sei es, KI für die Wissenschaft zu demokratisieren und ein vortrainiertes Modell bereitzustellen, das die wissenschaftliche Analyse verschiedener Probleme und Bereiche verbessern könne.
Very happy to start this initiative @PolymathicAI with our amazing team members and scientific advisors!
The mission: Building #opensource AI models trained across disciplines that deliver scientific discoveries 💪
Site: https://t.co/ABpOxVqQGl
Github: https://t.co/HmPRC06oPo pic.twitter.com/ccVqMoukUw— Shirley Ho (@cosmo_shirley) October 10, 2023
Meta versuchte ein ähnliches Projekt mit dem Open Source KI-Modell Galactica, das für wissenschaftliche Aufgaben optimiert war, aber hauptsächlich auf Sprache als Trainingsgrundlage setzte. Das Modell wurde von anderen Forschenden wegen der erzeugten Fehlinformationen so heftig kritisiert, dass Meta es nach wenigen Tagen vom Netz nahm.