Metas neues KI-System versteht und transkribiert gesprochene Sprache in mehr als 1.600 Sprachen
Laut Metas Forschungsabteilung Fundamental AI Research (FAIR) soll Omnilingual ASR gesprochene Sprache in über 1.600 Sprachen transkribieren können, darunter 500 seltene Sprachen. Es kann sich neue Sprachen sogar per Few-Shot-Prompting aneignen.
Selbst führende Anbieter sind laut dem Bundesamt für Sicherheit in der Informationstechnik (BSI) nicht zuverlässig gegen sogenannte Evasion-Angriffe auf KI-Sprachmodelle geschützt. Dabei schleusen Angreifer versteckte Anweisungen in scheinbar harmlose Inhalte ein, etwa über Webseiten, E‑Mails oder Code‑Dateien. Das kann dazu führen, dass Modelle Sicherheitsregeln umgehen, Daten preisgeben oder unerwünschte Aktionen ausführen.
Das BSI hat nun einen Leitfaden mit konkreten Gegenmaßnahmen veröffentlicht, darunter technische Filter, sicheres Prompt-Design und organisatorische Schutzmaßnahmen. "Es muss jedoch beachtet werden, dass es derzeit keine einzelne, absolut sichere Lösung zur Abwehr von Evasion‑Angriffen gibt", schreibt das BSI.
OpenAI-CEO Sam Altman sagt, dass KI eines Tages Gedichte auf dem höchsten menschlichen Niveau schreiben kann – 10 von 10. Dennoch werde das die Menschen kaum bewegen. Sie schätzten an Kunst vor allem, dass sie von Menschen stammt. Ein KI-Gedicht könne technisch perfekt sein, aber ohne emotionale Tiefe bleiben.
Altman vergleicht das mit Schach: Obwohl KI besser spielt, wollen Spieler lieber gegen Menschen antreten. Der Reiz liege im menschlichen Vergleich, nicht in der Maschine. Auch das Zuschauen zweier KIs sei schnell langweilig. Altman sagte bereits früher, dass er an eine neue Wertschätzung menschlicher Inhalte glaubt, weil Menschen authentischen Quellen mehr vertrauen, je mehr KI-generierte Texte und Bilder auftauchen.
Das KI-Start-up Inception hat 50 Millionen US-Dollar frisches Kapital erhalten. Die Finanzierung wurde von Menlo Ventures angeführt, mit dabei sind Microsofts M12, Nvidia, Databricks und Snowflake.
Inception konzentriert sich auf sogenannte Diffusionsmodelle (dLLMs), die nicht wie klassische Sprach-KIs Wort für Wort Text generieren, sondern Inhalte stufenweise verfeinern. Die Technik kennt man bisher primär aus der Bildgenerierung. Inception will sie jetzt auf Text und Code übertragen.
Mercury ist über Partner wie OpenRouter und Poe verfügbar und kostet 0,25 Dollar pro Million Eingabetokens sowie 1 Dollar für Ausgabetokens – also mit einem klaren Geschwindigkeits- und Preisvorteil gegenüber klassischen LLMs.
Korrektur: Eine frühere Version dieses Artikels hat Inception mit dem "Inflection.ai" verwechselt, dem Ex-KI-Start-up von Mustafa Suleyman.
ChatGPTs API und Web-Version nutzen laut Studie völlig verschiedene Quellen
Eine aktuelle Studie zeigt deutliche Unterschiede in ChatGPTs Nachrichtenempfehlungen: Während die API überwiegend auf enzyklopädische Inhalte verweist, bevorzugt das Web-Interface lizenzierte Medien – in Deutschland häufig Angebote aus dem Springer-Verlag.
Wie genau OpenAIs KI-Modell seine Quellen auswählt, bleibt jedoch weitgehend intransparent und erinnert in seiner Undurchsichtigkeit an Googles Vorgehen, mit dem Unterschied, dass Google zumindest darauf ausgelegt ist (oder war), dass Nutzer die Originalquellen tatsächlich anklicken.
OpenAI-Konkurrent Anthropic plant Umsatzwachstum von 4,7 auf 70 Milliarden Dollar bis 2028
Anthropic plant ein beispielloses Umsatzwachstum: Von 4,7 Milliarden Dollar im Jahr 2025 soll der Umsatz bis 2028 auf 70 Milliarden steigen. Möglich machen sollen das eine stark verbesserte Bruttomarge, der Fokus auf API-Verkäufe an Unternehmen und das Entwickler-Tool Claude Code. Die Prognosen sind extrem ehrgeizig und könnten das Narrativ einer KI-Blase weiter befeuern.
Laut OpenAI sind eure Aufgaben zu banal, um den KI-Fortschritt noch zu bemerken. Die meisten Menschen würden KI noch als Chatbots oder bessere Suchmaschinen sehen, obwohl die Systeme bereits komplexe Denkaufgaben lösen können, die früher nur von Experten in einer oder mehreren Stunden bewältigt wurden. Die öffentliche Wahrnehmung sei hinter der tatsächlichen Entwicklung zurück, schreibt das Unternehmen.
Bald erwarten wir Systeme, die Aufgaben erledigen können, für die ein Mensch Tage oder Wochen braucht; wir wissen nicht, wie wir über Systeme denken sollen, die Aufgaben lösen könnten, für die ein Mensch Jahrhunderte bräuchte.
In den nächsten Jahren erwartet OpenAI Systeme, die selbstständig neue Entdeckungen machen können – zunächst kleine ab 2026, ab 2028 auch größere. Laut OpenAI ist der „Preis pro Intelligenzeinheit“ in den vergangenen Jahren circa um das 40-Fache pro Jahr gesunken. Bei dieser Rate könnten künftig auch Aufgaben automatisiert werden, die heute noch Wochen menschlicher Arbeit erfordern.
Der Unternehmer Niels Hoven veröffentlichte ein Alphabetbuch mit fast 1000 KI-Illustrationen – aus seiner Sicht zu aufwendig für menschliche Künstler. Bei etwa zwei Stunden pro Bild hätte die Produktion rund 50.000 Dollar gekostet. In sozialen Medien und Amazon-Kommentaren gab es für diese Entscheidung Kritik.
Hoven verteidigt sich: Ohne KI hätte das Hardcover rund 200 Dollar kosten müssen. Dank generativer KI könne das Buch als kostenloses PDF erscheinen und für 30 Dollar als Hardcover verkauft werden. Laut Hoven gehe der gesamte Betrag an Amazon für Druck und Versand, er selbst verdiene daran nichts. Das Buch sei ohne KI nicht möglich gewesen und solle Kindern beim Lesenlernen helfen. Zur Wahrheit gehört auch, dass es Werbung für sein Unternehmen ist, das eine entsprechende Lern-App vertreibt.
Forschende haben Googles neueste Video-KI Veo 3 mit chirurgischen Aufnahmen getestet – und eine deutliche Kluft zwischen optischer Brillanz und medizinischem Verständnis festgestellt. Das System erzeugt verblüffend plausible Bilder, die fachlich oft keinen Sinn ergeben.