Opera und Google Cloud haben ihre Zusammenarbeit ausgebaut. Durch die Integration von Googles Gemini-Modellen erhält der Opera-Browser neue KI-Funktionen für die Bilderzeugung und Sprachausgabe.
Die Browser-KI Aria basiert auf Operas Multi-Lemma-Engine "Composer AI", die je nach Aufgabe entscheidet, welches Sprachmodell verwendet wird. Durch die Integration der Gemini-Modelle soll Aria den Nutzern aktuellere und bessere Informationen liefern, schreibt das norwegische Unternehmen in chinesischer Hand.
Opera experimentiert bereits seit über einem Jahr mit KI-Funktionen in seinen Browsern. Alle Hauptbrowser des Unternehmens sowie der Gaming-Browser Opera GX bieten mittlerweile Zugriff auf eine Browser-KI.
Der jüngste Feature-Drop, der aus der Kooperation mit Google Cloud resultiert, bringt kostenlose Bilderzeugung auf Basis von Googles Imagen-2-Modell in Operas Browser-KI Aria. Die Modelle laufen auf der KI-Plattform Vertex AI von Google.
Außerdem kann Aria dank Googles Text-to-Speech-Technologie ihre Antworten in gesprochener Form ausgeben, um einen konversationsähnlichen Austausch zu ermöglichen.
Opera ist überzeugt, dass es in Zukunft nicht eine dominierende KI geben wird, sondern ein Ökosystem verschiedener Anbieter und Modelle. Mit seiner "Composer AI" will sich das Unternehmen die Flexibilität bewahren, für jeden Anwendungsfall die am besten geeignete Technologie einzusetzen.
Um den wachsenden Rechenbedarf zu decken, hat Opera nach eigenen Angaben kürzlich ein mit grüner Energie betriebenes KI-Rechenzentrum mit Nvidia-DGX-Supercomputern in Island eröffnet.
Google soll auch mit Apple über eine Integration von Gemini in iOS verhandeln. Allerdings dürfte hier zunächst OpenAI den Zuschlag erhalten. Im Juni soll Apple auf der WWDC seine Pläne für generative KI und im Zuge dessen auch eine ChatGPT-Integration ankündigen. Eine Google-KI-Integration könnte später folgen, die Verhandlungen sollen noch laufen.