Stable Diffusion Start-up launcht LLM Code Generator StableCode

8. August 2023

SDXL 0.9 prompted by Stabiliy AI

Mit StableCode veröffentlicht Stability AI ein umfangreiches Sprachmodell zur Codegenerierung als Open-Source-Software unter der Apache-Lizenz, Version 2.0.

Laut Stability AI basiert StableCode auf drei Modellen: Das drei Milliarden Parameter umfassende Basismodell, basierend auf Eleuthers GPT-NeoX, das mit zahlreichen Programmiersprachen aus dem BigCode-Datensatz vortrainiert und dann mit weiteren Programmiersprachen wie Python, Go, Java, Javascript, C, Markdown und C++ mit insgesamt 560 Milliarden Token erweitert wurde.

Auf dem Basismodell baut ein Instruktionsmodell auf, das mit konkreten Anwendungsbeispielen zur "Lösung komplexer Programmieraufgaben" nach der Alpaca-Formel verfeinert wurde. Dazu verwendete Stability AI insgesamt 120.000 Paare von Anweisungen und beispielhaften Lösungen.

Stability AI legt in der Ankündigung keine Bewertung der Leistungsfähigkeit des Modells im Vergleich zu bestehenden Modellen wie Starcoder oder Github Copilot vor.

StableCode 16K: Code-Modell mit großem Kontextfenster

Neben dem Standardmodell mit einem 4K-Kontextfenster gibt es StableCode auch in einer 16K-Variante. Durch das größere Kontextfenster kann das Modell zur Lösung einer Aufgabe mehr Code auf einmal betrachten und so möglicherweise besseren Code generieren.

Laut Stability AI kann das 16K-Modell das Äquivalent von bis zu fünf mittelgroßen Python-Dateien gleichzeitig überprüfen oder bearbeiten, was besonders Anfängern beim Lernen helfen soll. Beide Modelle können einzelne oder mehrere Zeilen Code generativ schreiben und vervollständigen.

"Menschen aus allen Bereichen werden bald in der Lage sein, Code zu erstellen, um ihre alltäglichen Probleme zu lösen und ihr Leben mit KI zu verbessern, und wir würden gerne dabei helfen, dass das passiert", schreibt das Unternehmen.

Neben der Version 1.0 des Bildmodells SD XL hat Stability AI im April sein erstes eigenes Open-Source-Sprachmodell StableLM sowie "Free Willy" veröffentlicht, ein auf Metas Llama v2 basierendes Sprachmodell, das mit einem synthetischen Datensatz verfeinert wurde. Es soll die Leistung des Originalmodells und teilweise von GPT-3.5 (ChatGPT) erreichen und übertreffen.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Stable Diffusion Start-up launcht LLM Code Generator StableCode

StableCode 16K: Code-Modell mit großem Kontextfenster

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.