Anzeige
Skip to content
Read full article about: Google integriert Recherche-Tool NotebookLM in Gemini-Chatbot

Google verknüpft sein Recherche-Tool NotebookLM direkt mit dem Chatbot Gemini. Dadurch können Nutzer spezifische Notizbücher als Kontextquelle für ihre Anfragen an Gemini auswählen und das Wissen des Chatbots abseits vom Trainingsmaterial und Webquellen erweitern. Zwar gibt es auch eine auf einem Gemini-Sprachmodell basierende Chatfunktion innerhalb von NotebookLM, jedoch stark eingeschränkt – allein Chatverläufe werden hier etwa nicht gespeichert. Die neue Funktion ermöglicht außerdem die Nutzung mehrerer Notizbücher gleichzeitig sowie die Integration in "Gems", die personalisierten Versionen des Chatbots. Das Feature scheint stufenweise und zunächst an Browser-Nutzer verteilt zu werden, App-Nutzer dürften aber bald folgen.

NotebookLM startete 2023 als experimentelles Werkzeug. Inzwischen hat es sich gerade im Bildungsbereich als eine Software mit vorbildlicher KI-Integration etabliert. Mit dem Tool lassen sich unkompliziert RAG-Umgebungen aufsetzen und so große Dokumentsammlungen analysier- und durchsuchbar machen. Google spendiert NotebookLM regelmäßig neue Funktionen, zuletzt unter anderem eine für Deep Research.

Read full article about: OpenAI veröffentlicht neue Modelle für seine Realtime API

OpenAI aktualisiert die Realtime API mit drei neuen Modell-Snapshots für Transkription, Sprachsynthese und Steuerung. Die Variante gpt-4o-mini-transcribe soll laut den Entwicklern weniger Inhalte erfinden. Für die Text-zu-Sprache-Ausgabe senkt gpt-4o-mini-tts die Wortfehlerrate um 35 Prozent. Das für Sprachassistenten relevante Modell gpt-realtime-mini setzt Anweisungen laut Messungen um 22 Prozent genauer um und verbessert Funktionsaufrufe um 13 Prozent.

OpenAI nennt außerdem explizit Verbesserungen für Chinesisch, Japanisch, Indonesisch, Hindi, Bengali und Italienisch. Die Modelle sind ab sofort nutzbar.

Read full article about: SchedMD-Übernahme: Nvidia sichert sich wichtiges Rechenzentrums-Tool

Nvidia übernimmt den Softwareanbieter SchedMD, um seine Präsenz im Bereich Open-Source-Technologie auszubauen. Das Unternehmen teilte am Montag mit, dass es die Software "Slurm" von SchedMD weiterhin als Open Source vertreiben werde. Slurm hilft dabei, große Rechenaufgaben in Rechenzentren zu planen und die Serverkapazitäten effizient zu nutzen.

Laut Nvidia ist diese Technologie eine kritische Infrastruktur für generative KI, die von Entwicklern zum Trainieren von Modellen verwendet wird. Finanzielle Details der Übernahme wurden nicht veröffentlicht. SchedMD wurde 2010 in Kalifornien gegründet und beschäftigt rund 40 Mitarbeiter. Zu den Kunden zählen unter anderem der Cloud-Anbieter CoreWeave und das Barcelona Supercomputing Center.

Read full article about: iRobot meldet Insolvenz an und geht an chinesischen Zulieferer

Der Saugroboter-Pionier iRobot hat Insolvenz angemeldet und plant, die Kontrolle an seinen chinesischen Hauptlieferanten Shenzhen PICEA Robotics zu übergeben. Laut Bloomberg werden die Aktien des Roomba-Herstellers im Rahmen des Insolvenzplans ihren Wert verlieren. Das Unternehmen wird von der Börse genommen, soll aber als operativer Geschäftsbetrieb erhalten bleiben.

Shenzhen PICEA hatte zuvor Schulden in Höhe von 191 Millionen Dollar von der Carlyle Group übernommen, um den Deal vorzubereiten. iRobot begründet den Schritt mit Umsatzrückgängen nach der Pandemie, Lieferkettenproblemen und günstigerer Konkurrenz. Eine geplante Übernahme durch Amazon scheiterte 2022 am Widerstand der EU-Behörden. In einer Stellungnahme versichert iRobot, dass Löhne und Lieferanten während des gerichtlichen Verfahrens weiter bezahlt werden. Das Unternehmen beziffert seine Vermögenswerte und Verbindlichkeiten auf 100 bis 500 Millionen Dollar.

Read full article about: Adobe integriert Photoshop, Acrobat und Express direkt in die Benutzeroberfläche von ChatGPT

Adobe integriert Photoshop, Acrobat und Express direkt in die Benutzeroberfläche von ChatGPT. Nutzer des Chatbots können nun Bilder und Dokumente kostenlos per Texteingabe bearbeiten. Mit der Photoshop-Integration lassen sich Fotos durch einfache Beschreibungen anpassen, etwa um Hintergründe zu ändern oder Effekte hinzuzufügen. Adobe Express ermöglicht das Erstellen von Designs wie Einladungen auf Basis von Vorlagen, während Acrobat die direkte Bearbeitung von PDFs wie Lebensläufen im Chat erlaubt.

Die Einrichtung funktioniert so: In ChatGPT unter den eigenen Einstellungen den Bereich "Apps & Connectors" öffnen, die gewünschte Adobe-App auswählen und auf "Verbinden" klicken. Danach tippt man im Chat auf das Plus-Zeichen, wählt unter "Mehr" die App aus und schreibt seinen Befehl. Alternativ kann man direkt "/AdobePhotoshop" oder "/AdobeExpress" oder "/AdobeAcrobat" gefolgt vom Wunsch eingeben.

Adobe empfiehlt, Befehle möglichst klar zu formulieren und komplexe Aufgaben in einzelne Schritte aufzuteilen. Nach jeder Anpassung lassen sich die Ergebnisse mit Schiebereglern verfeinern.

Open-Source-Modell LongCat zeigt: Gute Bild-KI geht auch ohne Parameter-Flut

LongCat-Image zeigt, wie viel Bildqualität und Textpräzision Meituan aus nur 6 Milliarden Parametern herausholt. Statt stumpfer Skalierung setzen die Entwickler auf saubere Daten, clevere Architektur und eine ungewöhnlich genaue Textkodierung. Das Ergebnis wirkt wie ein kleiner, aber sehr gezielter Gegenentwurf zum „größer ist besser“-Trend.

Read full article about: OpenAI schafft Sperrfrist für Aktien ab, um die Risikobereitschaft zu erhöhen

OpenAI will die Risikobereitschaft seiner Angestellten erhöhen. Dazu hat das Unternehmen laut Wall Street Journal eine Regelung abgeschafft, nach der neue Mitarbeiter mindestens sechs Monate im Unternehmen bleiben mussten, bevor ihre Aktienanteile übertragen wurden. Die Änderung soll Mitarbeitern die Angst nehmen, entlassen zu werden, bevor sie ihre ersten Anteile erhalten. OpenAI hatte die Frist erst im April von zwölf auf sechs Monate verkürzt.

Der Schritt zeigt den harten Wettbewerb um KI-Talente: Meta, Google und Anthropic locken Spitzenforscher mit Gehaltspaketen von bis zu 100 Millionen Dollar. OpenAI gibt dieses Jahr rund sechs Milliarden Dollar für aktienbasierte Vergütungen aus, fast die Hälfte des erwarteten Umsatzes. Die hohen Personalkosten drücken weiter auf die Margen in einem ohnehin schon hart umkämpften Markt.

Read full article about: Google Translate startet Live-Übersetzung per Kopfhörer als Android-Beta – Gemini erhält Tonfall und Rhythmus

Google integriert Gemini in Google Translate für bessere Textübersetzungen und startet eine Beta für Echtzeit-Sprachübersetzung über Kopfhörer. Gemini versteht nun Redewendungen, lokale Ausdrücke und Slang besser und überträgt sie natürlicher, statt sie wörtlich zu übersetzen. Die verbesserte Textübersetzung startet in den USA und Indien für Englisch und fast 20 Sprachen, darunter Spanisch, Hindi, Chinesisch, Japanisch und Deutsch. Die App ist für Android und iOS sowie im Web verfügbar.

Die Live-Übersetzung nutzt Geminis Sprache-zu-Sprache-Fähigkeiten und behält Tonfall, Betonung und Rhythmus des Sprechers bei. Die Beta ist zunächst auf Android in den USA, Mexiko und Indien verfügbar und unterstützt über 70 Sprachen. iOS und weitere Länder folgen 2026.

Zusätzlich erweitert Google die Sprachlern-Tools um fast 20 neue Länder, darunter Deutschland, Indien, Schweden und Taiwan.

Read full article about: Skills-System bei OpenAI entdeckt: ChatGPT soll Aufgaben mit Modulen effizienter lösen

OpenAI hat offenbar das von Anthropic im Oktober eingeführte Skills-System adaptiert. Darauf deutet ein Fund des Nutzers Elias Judin hin, der entsprechende Hinweise veröffentlichte.

Er stieß auf Verzeichnisse wie „pdfs" und „spreadsheets", die jeweils Dateien mit dem Namen „skill.md" enthielten. Diese Dateien enthalten Anweisungen für den Umgang mit Dokumenten und Tabellen. Ein Skill besteht im Kern aus einem Ordner mit einer Markdown-Datei und optionalen Ressourcen wie Skripten. Jedes KI-Werkzeug mit Dateisystemzugriff kann diese nutzen. Bei OpenAI tauchte die Unterstützung für Skills im Codex-CLI-Tool und in ChatGPT selbst auf.

Screenshot Github

Die Struktur legt nahe, dass OpenAI die Werkzeuge der KI nun ähnlich wie Apps oder Module organisiert, um spezifische Aufgaben zu lösen. Judin dokumentierte seine Entdeckung, die er nach eigenen Angaben mit einem „5.2 pro"-Modell machte, bei Github.

Das modulare Skill-System wurde erstmals von Anthropic im Oktober vorgestellt, damit der KI-Assistent Claude spezialisierte Aufgaben durch automatisch geladene Skripte und Ressourcen effizienter erledigen kann.