Anzeige
Skip to content
Read full article about: Gemini-KI mit eigenen Daten: Google veröffentlicht "File Search Tool"

Google hat das File Search Tool in die Gemini-API integriert. Damit können Entwicklerinnen und Entwickler eigene Dateien über eine Vektordatenbank anbinden, um Gemini-Antworten auf konkrete Inhalte zu beziehen. Das Tool übernimmt dabei die Speicherung, Dateiaufteilung, Vektorsuche und das Einfügen der gefundenen Inhalte in eine Anfrage.

Die Nutzung ist kostenlos, abgerechnet wird nur die erste Indexierung der Daten (0,15 US-Dollar pro eine Million Tokens). Unterstützt werden Formate wie PDF, DOCX, TXT und JSON. Die Antworten enthalten automatisch Quellenverweise. Laut Google wird das Tool unter anderem für interne Suchsysteme und Chatbots eingesetzt. Dokumentation und eine Demoversion sind im Google-AI-Studio verfügbar.

Read full article about: Sechs KI-Pioniere sprechen über KI-Durchbrüche und überhöhte Erwartungen

KI-Elefantenrunde bei der Verleihung des Queen Elizabeth Prize 2025: Sechs führende Köpfe der KI-Forschung – Bill Dally, Yoshua Bengio, Fei-Fei Li, Yann LeCun, Jeff Hinton und Nvidia-CEO Jensen Huang – sprachen über persönliche Wendepunkte und die Entwicklung heutiger KI-Technologien.

Themen waren die Rolle von GPUs, große Sprachmodelle, selbstüberwachtes Lernen und der Einfluss von Bilddatensätzen wie ImageNet. Huang betonte, dass KI keine Blase sei, sondern eine neue Industrie mit wachsendem Bedarf an Rechenzentren. Li und LeCun warnten hingegen vor überzogenen Hoffnungen auf menschenähnliche Intelligenz. Die Runde war sich einig, dass KI langfristig viele Lebensbereiche prägen wird, es aber noch große wissenschaftliche Herausforderungen gibt.

Read full article about: Googles KI-Chips TPU v7 jetzt allgemein verfügbar

Google Cloud kündigt die allgemeine Verfügbarkeit seiner siebten TPU-Generation Ironwood für das Training und die Ausführung großer KI-Modelle an. Ironwood bietet laut Google eine zehnfache Spitzenleistung im Vergleich zu TPU v5p und ist viermal effizienter als TPU v6e. Erste Nutzer wie Anthropic, Lightricks und Essential AI setzen die Chips bereits für skalierbare KI-Anwendungen ein. Laut Amin Vahdat, VP und GM für KI-Infrastruktur bei Google, sind alle verfügbaren TPU-Chips aller Generationen derzeit vollständig ausgelastet.

Parallel bringt Google mit Axion neue Arm-basierte Virtual Machines für Alltags-Workloads. Die Axion N4A-Instanzen liefern laut Vimeo und ZoomInfo bis zu 60 Prozent bessere Preis-Leistung als vergleichbare x86-Systeme. Beide Hardwarelinien sollen Rechenleistung günstiger und flexibler machen.

Sam Altman verteidigt OpenAIs 1,4-Billionen-Wette nach Bubble-Kritik

OpenAI plant Investitionen in Billionenhöhe für die Recheninfrastruktur – und das bei vergleichsweise geringen 20 Milliarden ARR. OpenAI-CEO Sam Altman rechtfertigt diese Pläne in einem langen Beitrag auf der Plattform X. Staatliche Subventionen lehnt er ab, eine staatliche KI-Infrastruktur hält er jedoch für sinnvoll.

Read full article about: Google bringt Gemini Deep Reseach für eigene Daten

Googles KI-Funktion Gemini Deep Research kann nun auch Inhalte aus Gmail, Drive und Chat in ihre Recherchen einbeziehen. Nutzer können auswählen, ob die KI neben der Websuche auch E-Mails, Dokumente oder Chatverläufe analysieren soll, um etwa Marktanalysen oder Wettbewerbsvergleiche zu erstellen. Die KI erstellt einen mehrstufigen Plan, durchsucht Quellen und erstellt auf Wunsch Berichte oder Podcasts. Das Angebot ist bisher nur auf dem Desktop verfügbar, soll aber auf Mobilgeräte ausgeweitet werden.

Deep Research ist eine agentische Funktion, und ist als solche anfällig für Cybersecurity-Attacken. Daher sollte man gerade im Kontext privater Daten sehr bewusst damit umgehen. Kürzlich zeigte ein Team, dass eine ähnliche Deep-Research-Funktion bei ChatGPT beim E-Mail-Zugriff dazu gebracht werden konnte, Daten zu leaken. Bei Googles Standard-Gemini-Assistent reichte schon ein manipulierter Kalendereintrag.

Gerichtsurteil: KI-Bildgenerator "Stable Diffusion" ist keine "rechtsverletzende Kopie"

Der High Court in London hat die zentrale Urheberrechtsklage von Getty Images gegen Stability AI abgewiesen. Interessant ist das Urteil insbesondere wegen der klaren Feststellung zur sekundären Urheberrechtsverletzung.

Read full article about: Telekom-KI-Cloud steigert KI-Rechenleistung in Deutschland angeblich um 50 Prozent

Die Deutsche Telekom und Nvidia starten in München die Industrial AI Cloud, eine der größten KI-Infrastrukturen Europas. Dort werden mehr als 1.000 NVIDIA DGX B200-Systeme und RTX PRO Server mit bis zu 10.000 NVIDIA Blackwell-GPUs installiert. Das Volumen der Kooperation soll bei mehr als einer Milliarde Euro liegen.

Laut der Telekom steigt durch das neue Rechenzentrum die KI-Rechenleistung in Deutschland um 50 Prozent. Zum Vergleich: Sam Altman sagte kürzlich, dass OpenAI bis Ende 2025 "weit über eine Million GPUs" online haben wird. Und das ist nur OpenAI.

Ziel sei es, europäische Unternehmen bei der Entwicklung eigener KI-Anwendungen mit lokalen Daten zu unterstützen. SAP, Polarise und Agile Robots sind als Partner beteiligt. Die Plattform ermöglicht unter anderem die Simulation von Fabriken, das Training von Robotern oder das lokale Ausführen großer Sprachmodelle. Die Initiative ist privatwirtschaftlich, unabhängig von EU-Förderungen, und Teil der "Made 4 Germany"-Strategie.

"Deutschlands Stärke im Ingenieurwesen und in der Industrie ist legendär und wird jetzt durch KI noch weiter ausgebaut", sagt Nvidia-CEO Jensen Huang.