Google könnte den ultimativen A/B-Test für KI vs. klassische Suche ausrollen. Das Unternehmen plant offenbar, seinen Milliarden Suchnutzern die Option zu geben, in einen "AI-Modus" zu wechseln, der dem eigenen Gemini-Chatbot ähnlich sieht. Der Schritt ist eine Reaktion auf KI-Konkurrenten wie ChatGPT, die Nutzer mit direkten Antworten locken, anstatt eine Liste von Website-Links anzuzeigen. Der Button würde sich neben den spezifischen Suchen nach Bildern, Produkten, Videos und so weiter einreihen. Die Funktion wäre interessant, da Google so schnell herausfinden könnte, welchen Modus die Suchenden bevorzugen. Allerdings könnte sie auch den kartellrechtlichen Druck auf Google weiter erhöhen, wenn Kritiker argumentieren, dass Google seine marktbeherrschende Stellung ausnutzt, um sich auch bei KI-Chatbots als führend zu etablieren. Das Unternehmen steht bereits unter Beobachtung der US-Justiz.
Themen Hub KI in der Praxis
Künstliche Intelligenz ist im Alltag gegenwärtig – vom „Googeln“ über Gesichtserkennung bis zum Staubsaugerroboter. KI-Werkzeuge werden immer elaborierter und unterstützen Menschen und Unternehmen effektiver bei ihren Aufgaben, etwa bei der Generierung von Grafiken, beim Texten oder Coden oder bei der Interpretation großer Datenmengen.
Welche KI-Werkzeuge gibt es, wie funktionieren sind, wie helfen sie im Alltag – und wie verändern sie unser Leben? Mit diesen Fragen befassen wir uns in der Rubrik Künstliche Intelligenz in der Praxis.
OpenAI kündigt neue Funktionen für seine ChatGPT Desktop-Anwendungen an. Mit Updates für die Funktion "Work with Apps" kann ChatGPT nun Inhalte direkt aus verschiedenen Anwendungen wie Terminals, IDEs und Texteditoren lesen. Beispielsweise können Commits in einem Git-Repository analysiert oder Code für Xcode generiert werden. ChatGPT unterstützt auch Texte aus Apple Notes, Notion und Quip. Die Funktion liest den Inhalt direkt aus der Anwendung, kann aber nicht in die Anwendung schreiben. Der Benutzer muss den Inhalt also weiterhin manuell kopieren. Neu ist auch, dass der Advanced Voice Mode nun Inhalte aus der App vorlesen und Fragen dazu beantworten kann. Das Update ist ab sofort für macOS verfügbar, eine Windows-Version folgt. Unterstützt werden derzeit Apple Notes, Notion, TextEdit, Quip, Xcode, VS Code (inklusive Code, Code Insiders, VSCodium, Cursor, Windsurf), Jetbrains (inklusive Android Studio, IntelliJ, PyCharm, WebStorm, PHPStorm, CLion, Rider, RubyMine, AppCode, GoLand, DataGrip), TextEdit, Terminal, iTerm, Warp und Prompt.
Perplexity möchte mehr externe Plattformen an die eigene KI-Suche anbinden. Das KI-Start-up hat Carbon übernommen, ein Unternehmen, das Konnektoren für die Anbindung externer Datenquellen an LLMs entwickelt. Damit sollen Nutzer bald Apps wie Notion und Google Docs direkt mit Perplexity verbinden können. Das Carbon-Team wechselt geschlossen zu Perplexity, um die Entwicklung zu beschleunigen. Carbon soll es Nutzern erleichtern, die für sie relevanten Datenquellen anzubinden, egal ob interne Datenbanken, Cloud-Speicher oder Dokumentenablagen. Es ist interessant zu sehen, dass die großen KI-Plattformen wie ChatGPT und Perplexity und die Millionen B2B-SaaS-Lösungen gewissermaßen zur gleichen großen Lösung werden, nämlich ein Chat-Interface mit Internetzugang und angeschlossen an die eigenen Daten. Ein Verdrängungswettbewerb zeichnet sich ab.
OpenAI ermöglicht es nun, ChatGPT per Telefon oder WhatsApp-Nachricht zu nutzen. In den USA kann man unter der Nummer 1-800-242-8478 15 Minuten pro Monat kostenlos mit ChatGPT telefonieren, selbst mit alten Mobiltelefonen oder Festnetztelefonen. Weltweit lässt sich ChatGPT auch per WhatsApp-Nachricht erreichen, indem man die Nummer als Kontakt speichert. Derzeit ist die WhatsApp-Funktion auf Textnachrichten beschränkt, eine Authentifizierung für erweiterte Funktionen wie Bilderkennung ist geplant. Mit dem Update will OpenAI seine KI einem breiteren Publikum zugänglich machen. Das Projekt entstand aus einem internen Hackathon und wurde innerhalb weniger Wochen umgesetzt. Eine Demo gibt es im folgenden Video.
Das spanische KI-Start-up Magnific AI hat sein Bildgenerierungsmodell Super Real veröffentlicht. Nach Angaben des Unternehmens handelt es sich um eines der besten Modelle für realistische Bilder mit besonderem Fokus auf Profis in den Bereichen Architektur, Innendesign, Film und Fotografie. Magnific wurde im Mai von Freepik übernommen und startete mit einem KI-Upscaler als Produkt. Seitdem hat das Start-up weitere Features wie "Relight" veröffentlicht, das die Beleuchtung einschließlich des Hintergrunds von Bildern anpassen kann. Mit Super Real verfügt es nun über ein konkurrenzfähiges Bildmodell. Bildbearbeitungsfunktionen, wie sie etwa der Midjourney Editor bietet, fehlen allerdings noch.
IT'S FINALLY HERE!
🔥 Magnific's Super Real 🔥
The most amazing state-of-the-art generator for REALISTIC images specially designed for professionals (architecture, interior design, films, photography, etc). You have never seen a level of realism like this ✨
Info & prompts 👇 pic.twitter.com/KXMZOhtlCb
— Javi Lopez ⛩️ (@javilopen) December 17, 2024
Google rollt sein neues Modell Gemini 2.0 im eigenen Chatbot aus. Gemini Advanced-Nutzer erhalten ab sofort vorrangigen Zugriff auf das neueste experimentelle Modell Gemini-Exp-1206. Es soll bei komplexeren Aufgaben wie anspruchsvollen Coding-Herausforderungen, dem Lösen mathematischer Probleme sowie Argumentation und Anleitung helfen. Google weist darauf hin, dass sich das Modell noch in einer frühen Vorschauphase befindet und möglicherweise nicht wie erwartet funktioniert. Zudem hat es keinen Zugriff auf Echtzeitinformationen und ist nicht mit allen Gemini-Funktionen kompatibel. Das Modell ist für Gemini Advanced-Nutzer auf dem Desktop und im mobilen Web verfügbar. Es könnte das nächste größere Gemini 2.0 Modell (womöglich Pro) sein, da Gemini 2.0 Flash, die kleinere Version, bereits offiziell verfügbar ist.