Prof. Dr. Volker Tresp ist Professor für maschinelles Lernen an der Ludwig-Maximilians-Universität München und AG-Leiter in der Plattform Lernende Systeme. Er hält ChatGPT für einen Meilenstein in der KI-Forschung.
ChatGPT bewegt derzeit die Öffentlichkeit. Der Textbot gehört zu den so genannten großen Sprachmodellen, die als Durchbruch in der KI-Forschung gefeiert werden.
Versprechen große Sprachmodelle echten Fortschritt oder sind sie nur ein Hype? Wie können Sprachassistenten eingesetzt werden - und welche Voraussetzungen müssen wir in Europa schaffen, damit Wirtschaft und Gesellschaft davon profitieren?
Diese Fragen beantwortet Prof. Dr. Volker Tresp von der Ludwig-Maximilians-Universität München in einem Interview. Dort ist er Professor mit dem Forschungsschwerpunkt "Maschinelles Lernen in Informationsnetzwerken" und Co-Leiter der Arbeitsgruppe "Technologische Wegbereiter und Data Science" der Plattform Lernende Systeme.
Was sind große Sprachmodelle und was ist das Besondere an ihnen?
Volker Tresp: Große Sprachmodelle sind KI-Modelle, die mithilfe von Methoden des Maschinellen Lernens riesige Mengen an Texten analysieren. Sie nutzen mehr oder weniger das gesamte Wissen des weltweiten Internets, dessen Webseiten, soziale Medien, Bücher und Artikel.
Auf diese Weise können sie komplexe Fragen beantworten, Texte verfassen und Handlungsempfehlungen geben. Dialog- oder Übersetzungssysteme sind Beispiele für große Sprachmodelle, ganz aktuell natürlich ChatGPT.
Man könnte sagen, dass Wikipedia oder der Google-Assistent vieles davon auch können. Aber die neuen Sprachmodelle gehen kreativ mit dem Wissen um, ihre Antworten ähneln denen von menschlichen Autoren und sie können verschiedene Aufgaben eigenständig lösen.
Sie lassen sich auf beliebig große Datenmengen erweitern und sind sehr viel flexibler als vorangegangene Sprachmodelle. Die großen Sprachmodelle sind innerhalb von wenigen Jahren aus der Forschung in die Praxis gekommen und natürlich gibt es noch Unzulänglichkeiten, an denen die weltweit besten Köpfe arbeiten.
Aber auch wenn die Systeme gelegentlich noch fehlerhafte Antworten geben oder Fragen nicht richtig verstehen – die technischen Erfolge, die hier erreicht wurden, sind phänomenal. Mit ihnen hat die KI-Forschung einen wesentlichen Meilenstein auf dem Weg zu einer echten Künstlichen Intelligenz erreicht.
Wir müssen uns eines klarmachen: Die Technologie, von der wir hier reden, ist keine Zukunftsvision, sondern Realität. Jeder kann die Sprachassistenten und Chatbots über den Webbrowser nutzen. Die aktuellen Sprachmodelle sind wahre Gamechanger. Sie werden in den nächsten Jahren den Umgang mit Information und Wissen in Gesellschaft, Wissenschaft und Wirtschaft wesentlich verändern.
Welche Anwendungen ermöglichen die Sprachmodelle – und welche Voraussetzungen sind dafür zu schaffen?
Volker Tresp: Die Sprachmodelle lassen sich für verschiedene Einsatzbereiche nutzen. Sie können Informationssysteme und Suchmaschinen verbessern. Für Service-Engineers könnte zum Beispiel ein Sprachmodell Tausende Fehlerberichte und Problemmeldungen vorangegangener Fälle analysieren.
Ärztinnen und Ärzte kann es in Diagnose und Behandlung unterstützen. Die Sprachmodelle gehören zur Familie der sogenannten generativen Transformer-Modelle, die nicht nur Texte, sondern auch Bilder oder Videos erzeugen können. Transformer-Modelle erstellen Code, steuern Roboter und sagen molekularen Strukturen in der biomedizinischen Forschung voraus.
In sensiblen Bereichen wird es natürlich immer notwendig sein wird, dass der Mensch die Ergebnisse des Sprachmodells kontrolliert und letztlich eine Entscheidung fällt. Die Antworten der Sprachmodelle sind noch nicht immer richtig oder schweifen vom Thema ab. Wie lässt sich das verbessern? Wie lassen sich weiter Informationsquellen integrieren? Wie können wir die Sprachmodelle daran hindern, Vorurteile in den ihnen zugrunde liegenden Texten in ihre Antworten zu übernehmen?
Das sind wesentliche Fragen, zu denen großer Forschungsbedarf besteht. Es gibt also noch sehr viel zu tun. Wir müssen Talente im KI-Bereich fördern, Professuren und Forschungsstellen einrichten, um diese Herausforderungen zu adressieren.
Wenn wir Sprachmodelle für Anwendungen in und aus Europa nutzen wollen, brauchen wir außerdem europäische Sprachmodelle, die die hiesigen Sprachen beherrschen, die Bedürfnisse unserer Unternehmen und ethischen Anforderungen unserer Gesellschaft berücksichtigen. Aktuell werden die Sprachmodelle von amerikanischen und chinesischen Tech-Riesen erstellt – und kontrolliert.
Wer kann von großen Sprachmodellen profitieren? Nur große Unternehmen oder auch der Mittelstand?
Volker Tresp: Auch kleine und mittelgroße Unternehmen können Sprachmodelle in ihren Anwendungen einsetzen, weil sich diese sehr gut auf individuelle Probleme der Betriebe anpassen lassen. Sicherlich benötigen mittelständische Unternehmen dabei auch technische Unterstützung.
Die Anpassung der Sprachmodelle an die Bedürfnisse der Unternehmen können wiederum Dienstleister zu ihrem Geschäftsmodell entwickeln. Bei der Entwicklung von Lösungen sind der Kreativität der Unternehmen keine Grenzen gesetzt.
Ähnlich wie bei Suchmaschinen werden sich die Use Cases lawinenartig vermehren. Damit sich den kleinen und mittelgroßen Unternehmen nun aber keine finanziellen Hürden in den Weg stellen, brauchen wir große Basis-Sprachmodelle unter europäischer Schirmherrschaft, die einen kostenfreien oder günstigen Zugang zu der Technologie ermöglichen.