Weshalb eine Künstliche Intelligenz in die Schule muss

Die großen Fortschritte der KI-Entwicklung entstehen durch mehr Daten, größere Netzwerke, mehr Rechenleistung. Könnten sie in Zukunft auch außerhalb der Cloud laufen?

Der Trend bei Sprach-KIs geht zu immer größeren Modellen, die immer mehr Daten schlucken. Zu diesen Riesen gehören Googles Sprach-KI BERT, OpenAIs GPT-2, Facebooks RoBERTa und Nvidias Megatron. Letztere ist die aktuellste Sprach-KI, 24-mal größer als BERT-large und fünfmal größer als GPT-2.

Doch die riesigen KI-Modelle benötigen viel Rechenleistung: Nvidia empfiehlt für das Training von Megatron 512 Grafikchips. Und wer OpenAIs GPT-2 nachtrainieren will, bringt mit der neuesten Version selbst schnelle Server-Grafikkarten an ihr Limit.

Da die Sprachmodelle viel Rechenleistung und Energie benötigen, laufen sie nur in der Cloud. Kleinere Modelle können zwar lokal ohne Internetverbindung auf dem Smartphone oder auf einem Roboter ausgeführt werden - aber sie leisten dafür deutlich weniger.

Es braucht also kleinere KI-Modelle, die dennoch an die Leistungsfähigkeit ihrer riesigen Verwandten herankommen. Doch wie soll das gehen?

Back to School (of AI)

Die Lösung könnte eine Art KI-Schule sein, in der die kleinen KIs von den großen lernen.

KI-Forscher nennen diesen Prozess Destillation: Ein großes KI-Modell agiert als Lehrer, ein kleines als Schüler. Beim Training gibt die große KI ihr Wissen weiter: bei einer Sprach-KI etwa die 20 wahrscheinlichsten Worte, die einen unvollständigen Satz vollenden.

Das kleine KI-Modell lernt so, die Ergebnisse des großen KI-Modells zu reproduzieren – ohne dessen Umfang anzunehmen.

Forscher haben diese Methode nun auf die Sprach-KI BERT angewandt. Das Ergebnis: BERTs Schüler DistilBERT ist 60 Prozent kleiner, schneller und erreicht 95 Prozent von BERTs Leistung. In Zukunft soll DistilBERT noch mit weiteren Kleinmachmethoden, wie der Entfernung einiger Netzwerkverbindungen, geschrumpft werden.

Empfehlung

KI in der Praxis

OpenAIs neues KI-Modell "Orion" zeigt angeblich kaum Verbesserungen gegenüber GPT-4

Auf ähnliche Art hat Google den eigenen Next-Gen-Assistant verkleinert, der Ende des Jahres ohne Internetverbindung lokal auf Pixel-Smartphones laufen soll. Das knapp 100 Gigabyte große Sprachmodell wurde dafür auf knapp 0,5 Gigabyte reduziert.

Quelle: Medium

Community beitreten

Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!

Weshalb eine Künstliche Intelligenz in die Schule muss

Back to School (of AI)

OpenAIs neues KI-Modell "Orion" zeigt angeblich kaum Verbesserungen gegenüber GPT-4

Weiterlesen über Künstliche Intelligenz:

OpenAI: Mehr als 300 GPT-3 Apps am Start

Zehn nützliche Fähigkeiten, die Künstliche Intelligenz jetzt schon hat

GPT-3: OpenAI gibt Preise und Zugänge bekannt

KI-Coding kann Entwickler langsamer machen – auch wenn sie sich schneller fühlen

Musk präsentiert Grok 4: xAI-Modell übertrifft OpenAI und Google in Benchmarks

Katzen-Attacke auf Reasoning-Modell zeigt, wie wichtig "Context Engineering" ist

Weshalb eine Künstliche Intelligenz in die Schule muss

Back to School (of AI)

Weiterlesen über Künstliche Intelligenz:

Artikel teilen

Bankverbindung