OpenAIs GPT-4o imitiert spontan Nutzerstimmen in Sicherheitstests

9. August 2024

Midjourney prompted by THE DECODER

Kurz & Knapp

OpenAI hat einen Sicherheitsbericht für das neue KI-Sprachmodell GPT-4o veröffentlicht, das Text, Audio, Bilder und Video verarbeiten sowie Text, Audio und Bilder ausgeben kann. Über 100 externe Experten untersuchten potenzielle Risiken wie unbefugte Stimmgenerierung oder Erstellung von Fehlinformationen.
Eine unerwartete Eigenschaft wurde entdeckt: GPT-4o kann in seltenen Fällen kurzzeitig die Stimme des Nutzers imitieren. Um dem zu begegnen, erlaubt OpenAI nur vordefinierte Stimmen und hat einen Klassifikator entwickelt, der abweichende Ausgaben blockiert.
In anderen Bereichen sieht OpenAI nur minimale Risiken. Bei Audioeingaben mit Hintergrundgeräuschen oder Echos zeigte sich eine verminderte Sicherheitsrobustheit. Das Risiko für Katastrophen wurde in drei von vier Kategorien als gering eingestuft, bei der Überzeugungskraft als mittelhoch.

OpenAI hat einen detaillierten Sicherheitsbericht für GPT-4o veröffentlicht. Neben verbesserten Fähigkeiten wurde eine unerwartete Eigenschaft entdeckt: Das Modell kann spontan die Stimme des Nutzers imitieren.

OpenAI hat einen Sicherheitsbericht für sein neues KI-Sprachmodell GPT-4o vorgelegt. Das Modell kann Text, Audio, Bilder und Video verarbeiten sowie Text, Audio und Bilder ausgeben - entsprechend umfassend gestalteten sich die Sicherheitstests.

Die Entwickler führten umfangreiche Tests durch, unter anderem mit über 100 externen Experten. Diese untersuchten potenzielle Risiken wie die unbefugte Generierung von Stimmen oder die Erstellung von Fehlinformationen.

Laut dem Bericht hat OpenAI zahlreiche Sicherheitsmaßnahmen implementiert, um Risiken zu minimieren. So wurde das Modell darauf trainiert, bestimmte Anfragen abzulehnen, etwa zur Identifizierung von Sprechern anhand ihrer Stimme. Zudem wurden Klassifikatoren entwickelt, um unerwünschte Ausgaben zu blockieren.

GPT-4o imitiert spontan Nutzerstimme

Besonders kurios: GPT-4o kann in seltenen Fällen kurzzeitig die Stimme des Nutzers imitieren. Während der Tests beobachteten die Entwickler, dass das Modell manchmal unbeabsichtigt einen Satz in einer Stimme fortsetzte, die der des Nutzers ähnelte.

Beispiel für eine unbeabsichtigte Stimmerzeugung: Das Modell ruft "Nein!" und setzt dann den Satz mit einer Stimme fort, die der Stimme des Testperson ähnelt.

Um diesem Problem zu begegnen, hat OpenAI mehrere Sicherheitsmaßnahmen implementiert. So erlaubt das Unternehmen dem Modell nur die Verwendung von vordefinierten Stimmen, die in Zusammenarbeit mit professionellen Sprechern erstellt wurden - eine Maßnahme, die OpenAI kürzlich auch mit dem Beginn der ersten Ausrollphase angekündigt hat. Zusätzlich wurde ein Klassifikator entwickelt, der erkennt, wenn die Ausgabe des Modells von den zugelassenen Stimmen abweicht. In solchen Fällen wird die Ausgabe blockiert.

Trotz dieser Maßnahmen räumt OpenAI ein, dass die unbeabsichtigte Stimmimitation weiterhin eine Schwachstelle des Modells darstellt. Das Unternehmen betont jedoch, dass das Risiko durch den Einsatz der sekundären Klassifikatoren minimiert wird.

Nur minimale Risiken in anderen Bereichen

Neben dem Problem der Stimmimitation berichtet OpenAI über verschiedene andere Aspekte von GPT-4o. So zeigten die Tests generell eine verminderte Sicherheitsrobustheit bei Audioeingaben mit Hintergrundgeräuschen oder Echos. Auch bei der Erzeugung von Fehlinformationen und Verschwörungstheorien in Audioform gibt es laut OpenAI noch Probleme.

Das Unternehmen bewertete GPT-4o auch hinsichtlich potenzieller Katastrophenrisiken in den Bereichen Cybersicherheit, biologische Bedrohungen, Überzeugungskraft und Modellautonomie. In drei von vier Kategorien wurde das Risiko als gering eingestuft, bei der Überzeugungskraft als mittelhoch.

Source: GPT-4o System Card Blog

Verpassen Sie keine
aktuellen KI‑Einblicke.

Unabhängiger Journalismus, der Sie auf dem Laufenden hält.
Zugang zum Magazinarchiv und zu den Community‑Kommentaren.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

OpenAIs GPT-4o imitiert spontan Nutzerstimmen in Sicherheitstests

Kurz & Knapp

GPT-4o imitiert spontan Nutzerstimme

Nur minimale Risiken in anderen Bereichen

Verpassen Sie keineaktuellen KI‑Einblicke.

Verpassen Sie keine
aktuellen KI‑Einblicke.