Inhalt
summary Zusammenfassung

Anthropic hat die PDF-Unterstützung für sein KI-Sprachmodell Claude 3.5 Sonnet in einer öffentlichen Beta-Version veröffentlicht.

Anzeige

Claude kann nun sowohl Text als auch Bilder, Diagramme und Tabellen in PDF-Dateien analysieren und verstehen. Damit lassen sich laut Anthropic etwa Finanzberichte analysieren, wichtige Informationen aus juristischen Dokumenten extrahieren oder Dokumente übersetzen.

Die PDF-Unterstützung funktioniert, indem das System den Text extrahiert und jede Seite in ein Bild umwandelt. Claude analysiert dann sowohl den Text als auch die Bilder, um das Dokument besser zu verstehen. In einem dritten Schritt können die Ergebnisse mit anderen Funktionen von Claude kombiniert werden.

Video: Anthropic

Anzeige
Anzeige

Die maximale Dateigröße beträgt 32 MB und die Dokumente dürfen nicht mehr als 100 Seiten umfassen. Verschlüsselte oder passwortgeschützte PDF-Dateien werden nicht unterstützt.

Die Tokenkosten für die PDF-Verarbeitung hängen vom extrahierten Text und der Anzahl der Seiten ab. Nach Angaben von Anthropic werden pro Seite typischerweise zwischen 1.500 und 3.000 Token verbraucht, abhängig von der Dichte des Inhalts. Für die PDF-Verarbeitung fallen keine zusätzlichen Gebühren an.

Die PDF-Unterstützung befindet sich derzeit in der öffentlichen Beta-Phase und ist zunächst im Claude-Chat als Feature Preview und über die API mit dem Header "anthropic-beta: pdfs-2024-09-25" verfügbar. Eine Integration in Amazon Bedrock und Google Vertex AI soll folgen.

Anthropic gibt Tipps für optimale Ergebnisse

Für optimale Ergebnisse empfiehlt Anthropic, auf gut lesbare Texte und korrekt ausgerichtete Seiten zu achten. Bei der Referenzierung von Seitenzahlen sollte die im PDF-Viewer angezeigte logische Nummer verwendet werden.

Bei der API-Nutzung sollten PDFs vor dem Text in Anfragen platziert werden. Sehr große PDFs können in kleinere Teile aufgeteilt werden, wenn die Limits überschritten werden. Für wiederholte Analysen desselben Dokuments empfiehlt sich die Nutzung von Prompt-Caching. Beispiele für die PDF-Verarbeitung sind hier verfügbar.

Anzeige
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Empfehlung
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Anthropic hat die Unterstützung von PDF-Dateien für sein KI-Sprachmodell Claude 3.5 Sonnet in einer öffentlichen Beta-Version eingeführt, die es dem System ermöglicht, sowohl Text als auch Bilder, Diagramme und Tabellen in PDFs zu analysieren und zu verstehen.
  • Die PDF-Verarbeitung erfolgt in drei Schritten: Extraktion des Textes, Umwandlung jeder Seite in ein Bild und Analyse beider Komponenten durch Claude. Die Ergebnisse können dann mit anderen Funktionen des Sprachmodells kombiniert werden.
  • Für optimale Resultate empfiehlt Anthropic gut lesbare Texte, korrekt ausgerichtete Seiten und die Referenzierung logischer Seitenzahlen. Bei der API-Nutzung sollten PDFs vor dem Text platziert und große Dateien bei Bedarf aufgeteilt werden.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!