Google bringt seine Bild-KI Imagen 3 weltweit für alle Gemini-Nutzer - auch in den kostenlosen Accounts. Imagen 3 ist laut Google das bislang leistungsfähigste Modell zur Bilderzeugung und übertrifft in internen Tests Imagen 2, DALL-E 3, Midjourney v6 und Stable Diffusion 3, insbesondere bei der Umsetzung detaillierter Textbeschreibungen. Es bietet laut Google einen höheren Grad an Fotorealismus, folgt Prompts besser und soll weniger störende Artefakte erzeugen. Schwächen zeigt Imagen 3 noch bei Aufgaben, die numerisches Denken erfordern, sowie bei Prompts, die räumliches Denken und komplexe Sprache erfordern. Das Modell ist mit Sicherheitsfiltern und digitalen Wasserzeichen ausgestattet.
Video: Google