Anzeige
Skip to content

Google stellt günstigeres und schnelleres Gemini-3-Flash-Modell vor

Der Preiskampf bei KI-Modellen verschärft sich: Google bringt mit Gemini 3 Flash ein Modell auf den Markt, das die Konkurrenz von OpenAI und Anthropic bei Kosten und Geschwindigkeit deutlich unterbieten soll. Die Botschaft ist klar: Spitzenleistung muss nicht mehr teuer sein.

Read full article about: Amazon verhandelt über 10-Milliarden-Dollar-Investition in OpenAI

Amazon führt Gespräche über eine Investition von mindestens 10 Milliarden Dollar in OpenAI. Das berichten drei mit den Diskussionen vertraute Personen gegenüber The Information. Die Bewertung von OpenAI würde dabei auf über 500 Milliarden Dollar steigen. Das Geld soll OpenAI helfen, Serverkosten zu decken, darunter einen kürzlich vereinbarten 38-Milliarden-Dollar-Deal mit Amazon Web Services (AWS). Teil der Vereinbarung wäre auch, dass OpenAI Amazons eigene KI-Chips "Trainium" nutzt, anstatt sich nur auf Nvidia zu verlassen.

Zusätzlich diskutieren die Unternehmen über eine mögliche Umwandlung von ChatGPT in eine Einkaufsplattform. Allerdings könnte Microsofts exklusives Recht, OpenAI-Modelle an Cloud-Kunden zu verkaufen, die Möglichkeiten für Amazon einschränken. Die Gespräche begannen im Oktober nach der Unternehmensumstrukturierung von OpenAI, sind aber noch nicht abgeschlossen. OpenAI benötigt weiterhin dringend Kapital, da das Unternehmen erwartet, in den nächsten vier Jahren über 100 Milliarden Dollar zu verbrennen.

Read full article about: Google hat einen neuen KI-Agenten, der helfen soll, den Tag zu planen

Google hat einen neuen KI-Agenten, der helfen soll, den Tag zu planen. Der experimentelle Produktivitätsassistent namens CC stammt aus den Google Labs und basiert auf Gemini. Nach der Anmeldung verbindet sich CC mit Gmail, Google Kalender, Google Drive und dem Internet, um den Tagesablauf des Nutzers zu verstehen. Solche KI-Agenten mit Zugriff auf private Daten werfen bekannte Sicherheitsfragen auf.

Jeden Morgen liefert CC eine Zusammenfassung namens "Your Day Ahead" per E-Mail. Diese fasst Termine, wichtige Aufgaben und Neuigkeiten zusammen, etwa anstehende Rechnungen oder Termine. Der Agent erstellt bei Bedarf auch E-Mail-Entwürfe und Kalendereinträge. Nutzer können CC per E-Mail-Antwort steuern, eigene Wünsche mitteilen oder den Agenten bitten, sich Ideen und Aufgaben zu merken.

CC startet als früher Testlauf zunächst für Nutzer ab 18 Jahren in den USA und Kanada. Voraussetzung ist ein privates Google-Konto sowie ein Abo von Google AI Ultra oder anderen kostenpflichtigen Diensten. Interessierte können sich auf der Google Labs-Website für die Warteliste anmelden.

Read full article about: Google verbessert Gemini-Audiomodelle für realistischere KI-Stimmen

Google hat ein Update für Gemini 2.5 Flash Native Audio veröffentlicht, das Sprachassistenten verbessern soll. Das Modell kann nun komplexe Arbeitsabläufe besser bewältigen, Nutzeranweisungen präziser umsetzen und natürlichere Gespräche führen. Die Befolgung von Entwickleranweisungen stieg von 84 auf 90 Prozent. Auch die Gesprächsqualität in mehrstufigen Unterhaltungen wurde verbessert.

Laut Google erreicht das neue Audiomodell bei Funktionsaufrufen 71,5 Prozent Genauigkeit auf dem ComplexFuncBench-Benchmark und liegt damit vor OpenAIs gpt-realtime (66,5 Prozent); allerdings wurde hier wohl nicht gegen die neueste Realtime-Version getestet, die erst gestern erschien.

Das Update ist in Google AI Studio, Vertex AI, Gemini Live und Search Live verfügbar. Google-Cloud-Kunden nutzen die Technologie bereits. Entwickler können das Modell über die Gemini-API testen.

Read full article about: Google integriert Recherche-Tool NotebookLM in Gemini-Chatbot

Google verknüpft sein Recherche-Tool NotebookLM direkt mit dem Chatbot Gemini. Dadurch können Nutzer spezifische Notizbücher als Kontextquelle für ihre Anfragen an Gemini auswählen und das Wissen des Chatbots abseits vom Trainingsmaterial und Webquellen erweitern. Zwar gibt es auch eine auf einem Gemini-Sprachmodell basierende Chatfunktion innerhalb von NotebookLM, jedoch stark eingeschränkt – allein Chatverläufe werden hier etwa nicht gespeichert. Die neue Funktion ermöglicht außerdem die Nutzung mehrerer Notizbücher gleichzeitig sowie die Integration in "Gems", die personalisierten Versionen des Chatbots. Das Feature scheint stufenweise und zunächst an Browser-Nutzer verteilt zu werden, App-Nutzer dürften aber bald folgen.

NotebookLM startete 2023 als experimentelles Werkzeug. Inzwischen hat es sich gerade im Bildungsbereich als eine Software mit vorbildlicher KI-Integration etabliert. Mit dem Tool lassen sich unkompliziert RAG-Umgebungen aufsetzen und so große Dokumentsammlungen analysier- und durchsuchbar machen. Google spendiert NotebookLM regelmäßig neue Funktionen, zuletzt unter anderem eine für Deep Research.

Read full article about: OpenAI veröffentlicht neue Modelle für seine Realtime API

OpenAI aktualisiert die Realtime API mit drei neuen Modell-Snapshots für Transkription, Sprachsynthese und Steuerung. Die Variante gpt-4o-mini-transcribe soll laut den Entwicklern weniger Inhalte erfinden. Für die Text-zu-Sprache-Ausgabe senkt gpt-4o-mini-tts die Wortfehlerrate um 35 Prozent. Das für Sprachassistenten relevante Modell gpt-realtime-mini setzt Anweisungen laut Messungen um 22 Prozent genauer um und verbessert Funktionsaufrufe um 13 Prozent.

OpenAI nennt außerdem explizit Verbesserungen für Chinesisch, Japanisch, Indonesisch, Hindi, Bengali und Italienisch. Die Modelle sind ab sofort nutzbar.

Read full article about: SchedMD-Übernahme: Nvidia sichert sich wichtiges Rechenzentrums-Tool

Nvidia übernimmt den Softwareanbieter SchedMD, um seine Präsenz im Bereich Open-Source-Technologie auszubauen. Das Unternehmen teilte am Montag mit, dass es die Software "Slurm" von SchedMD weiterhin als Open Source vertreiben werde. Slurm hilft dabei, große Rechenaufgaben in Rechenzentren zu planen und die Serverkapazitäten effizient zu nutzen.

Laut Nvidia ist diese Technologie eine kritische Infrastruktur für generative KI, die von Entwicklern zum Trainieren von Modellen verwendet wird. Finanzielle Details der Übernahme wurden nicht veröffentlicht. SchedMD wurde 2010 in Kalifornien gegründet und beschäftigt rund 40 Mitarbeiter. Zu den Kunden zählen unter anderem der Cloud-Anbieter CoreWeave und das Barcelona Supercomputing Center.

Read full article about: iRobot meldet Insolvenz an und geht an chinesischen Zulieferer

Der Saugroboter-Pionier iRobot hat Insolvenz angemeldet und plant, die Kontrolle an seinen chinesischen Hauptlieferanten Shenzhen PICEA Robotics zu übergeben. Laut Bloomberg werden die Aktien des Roomba-Herstellers im Rahmen des Insolvenzplans ihren Wert verlieren. Das Unternehmen wird von der Börse genommen, soll aber als operativer Geschäftsbetrieb erhalten bleiben.

Shenzhen PICEA hatte zuvor Schulden in Höhe von 191 Millionen Dollar von der Carlyle Group übernommen, um den Deal vorzubereiten. iRobot begründet den Schritt mit Umsatzrückgängen nach der Pandemie, Lieferkettenproblemen und günstigerer Konkurrenz. Eine geplante Übernahme durch Amazon scheiterte 2022 am Widerstand der EU-Behörden. In einer Stellungnahme versichert iRobot, dass Löhne und Lieferanten während des gerichtlichen Verfahrens weiter bezahlt werden. Das Unternehmen beziffert seine Vermögenswerte und Verbindlichkeiten auf 100 bis 500 Millionen Dollar.

Read full article about: Adobe integriert Photoshop, Acrobat und Express direkt in die Benutzeroberfläche von ChatGPT

Adobe integriert Photoshop, Acrobat und Express direkt in die Benutzeroberfläche von ChatGPT. Nutzer des Chatbots können nun Bilder und Dokumente kostenlos per Texteingabe bearbeiten. Mit der Photoshop-Integration lassen sich Fotos durch einfache Beschreibungen anpassen, etwa um Hintergründe zu ändern oder Effekte hinzuzufügen. Adobe Express ermöglicht das Erstellen von Designs wie Einladungen auf Basis von Vorlagen, während Acrobat die direkte Bearbeitung von PDFs wie Lebensläufen im Chat erlaubt.

Die Einrichtung funktioniert so: In ChatGPT unter den eigenen Einstellungen den Bereich "Apps & Connectors" öffnen, die gewünschte Adobe-App auswählen und auf "Verbinden" klicken. Danach tippt man im Chat auf das Plus-Zeichen, wählt unter "Mehr" die App aus und schreibt seinen Befehl. Alternativ kann man direkt "/AdobePhotoshop" oder "/AdobeExpress" oder "/AdobeAcrobat" gefolgt vom Wunsch eingeben.

Adobe empfiehlt, Befehle möglichst klar zu formulieren und komplexe Aufgaben in einzelne Schritte aufzuteilen. Nach jeder Anpassung lassen sich die Ergebnisse mit Schiebereglern verfeinern.