Anzeige
Short

Googles PaLM 2 wird besser in Mathe, wenn man das Sprachmodell erst einmal durchatmen lässt.

In einem Paper haben Forschende untersucht, ob sich Sprachmodelle wie GPT-4 oder PaLM 2 als Optimierer eignen, die automatisch Lösungen für vordefinierte Probleme finden, wie zum Beispiel Filmempfehlungen oder das Lösen von Grundschulmathematikaufgaben.

Dabei versuchten die Sprachmodelle, selbstständig die besten Prompts für ihre Aufgabe zu finden. Besonders kurios ist der Prompt, mit dem PaLM 2-L Matheaufgaben besonders gut löste: "Atme tief durch und arbeite Schritt für Schritt an diesem Problem". Ohne Durchatmen sank die Genauigkeit um fast zehn Punkte.

Anzeige
Anzeige
Anzeige
Anzeige
Short

Laut Baidu-CEO Robin Li wurden in China bereits mehr als 70 große Sprachmodelle mit über einer Milliarde Parametern veröffentlicht. Baidu schließt sich damit anderen chinesischen Unternehmen wie SenseTime und den KI-Start-ups Baichuan Intelligent Technology, Zhipu AI und MiniMax an, die KI-Chatbots eingeführt haben, nachdem sie die Genehmigung der Behörden erhalten hatten. Die neueste Version des KI-Chatbots von Baidu, Ernie 3.5, wurde kürzlich für die chinesische Öffentlichkeit freigegeben.

Obwohl mehr als eine Milliarde Parameter nicht viel ist und einige Modelle die Billionen-Parameter-Grenze überschreiten, gibt es immer noch Platz für kleinere, spezialisierte Modelle, und es zeigt, wie schnell die chinesische KI-Industrie versucht, kommerziell nutzbare KI-Modelle auf den Markt zu bringen. Sie werden jedoch durch die Hardware behindert, da US-Bestimmungen den Export der neuesten KI-Chips von Nvidia, A100 und H100, nach China und in andere Länder verhindern. Der ChatGPT von OpenAI ist in China nicht verfügbar.

Anzeige
Anzeige
Google News