Inhalt
summary Zusammenfassung
DEEP MINDS Podcast
Podcast über Künstliche Intelligenz und Wissenschaft
KI bei der Bundeswehr und der BWI | DEEP MINDS #16

Mit einer Aufzeichnung hat ein Vortrag bereits eine längere Lebensdauer als ohne. Mit etwas KI-Unterstützung kann er aber noch viel mehr Mehrwert bieten.

Der Programmierer Simon Willison hat eine selbst entwickelte Methode vorgestellt, um Vorträge und Workshops nachhaltig aufzubereiten und der Öffentlichkeit besser zugänglich zu machen. Er nennt das Ergebnis "annotierte Präsentationen" - das sind Präsentationsfolien, die mit erläuternden Texten und weiterführenden Links angereichert werden.

Eigenes Browser-Tool für annotierte Präsentationen

Um annotierte Präsentationen möglichst effizient zu erstellen, hat Willison ein Browser-basiertes Tool gebastelt. Damit lassen sich Folien als Bilder hochladen, Alt-Texte und Kommentare hinzufügen und am Ende ein fertig formatiertes HTML-Dokument exportieren, das problemlos z. B. in einen WordPress-Blog eingefügt werden kann.

Alt-Texte von Bildern sind eine wesentliche Komponente für Screenreader und Suchmaschinenoptimierung, aber in der Regel mühsam zu erstellen. Für einen ersten Vorschlag dieser Texte hat Willison Optical Character Recognition (OCR) in sein Tool integriert.

Anzeige
Anzeige
Bild: Screenshot/THE DECODER

Auch wenn das Tool im Browser läuft, werden keine Daten mit dessen Server ausgetauscht, versichert der Entwickler. Beim Schreiben des Javascript-Quellcodes hat er sich - wie könnte es anders sein - von ChatGPT helfen lassen. Damit die Reihenfolge der Folien nicht durcheinander gerät, müssen sie korrekt nummeriert werden.

Automatische Transkription mit Claude bearbeiten

Der Text auf den Folien stammt aus dem Transkript des Vortrags, das Willison mit einem einfachen KI-Prompt verarbeitet. Das setzt allerdings voraus, dass überhaupt ein Transkript vorhanden ist. Falls der Vortrag auf YouTube verfügbar ist, können die automatisch generierten Untertitel von dort exportiert werden (z.B. mit downsub.com).

Fehler, die die Spracherkennung in das Transkript überträgt, werden auch in den bearbeiteten Text übertragen. Trotz (oder gerade wegen) der KI-Bearbeitung muss der Text daher vor der Veröffentlichung unbedingt Korrektur gelesen werden.

Reformat this transcript into paragraphs and sentences, fix the capitalization and make very light edits such as removing ums

(Formatiere dieses Transkript in Absätze und Sätze, korrigiere die Groß- und Kleinschreibung und nimm ganz leichte Änderungen vor, wie z. B. das Entfernen von "ähms".)

Prompt zur Bearbeitung eines Transkripts in lesbaren Text von Simon Willison

Prompt und Transkript speiste Willison in Claude 2 ein, da das Kontextfenster des Anthropic-Sprachmodells mit 100.000 Tokens zum Zeitpunkt der Entwicklung der Anwendung deutlich größer war als die Alternativen von OpenAI.

Inzwischen bietet OpenAI mit GPT-4-Turbo eine etwas genauere (aber immer noch ungenaue) Alternative. Wahrscheinlich erzielt man bessere Ergebnisse, wenn man die einzelnen Folien Schritt für Schritt verarbeitet.

Empfehlung

Die KI fügt sogar sinnvolle Formatierungen wie Stichpunkte in den obigen Prompt ein. Natürlich sollte man den Prompt an die eigenen Präsentationsunterlagen anpassen und im Idealfall Beispiele für das gewünschte Ergebnis in den Prompt einfügen.

Zwei bis drei Stunden Aufwand, die sich lohnen

Laut Willison hat dieses Format einige Vorteile gegenüber einem Video: "Selbst wenn die Präsentation professionell aufgenommen wurde, glaube ich nicht, dass ein Video allein ausreicht. Meine letzte Präsentation dauerte 40 Minuten - aber ich schaue mir nicht so viele 40-minütige YouTube-Videos pro Jahr an."

Willison ist überzeugt, dass sich der zusätzliche Aufwand von zwei bis drei Stunden pro Einsatz für die Vorbereitung der Vorträge sowohl für den Vortragenden selbst als auch für die Zuhörer lohnt. "Es verlängert die Lebensdauer des Vortrags erheblich und stellt sicher, dass die investierte Arbeit sowohl für mich als auch für die Menschen, denen ich helfen möchte, den größtmöglichen Nutzen bringt", schreibt Willison.

Ein lesbares Beispiel für die oben beschriebene Bearbeitung ist hier zu sehen und im folgenden Video.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Der Programmierer Simon Willison beschreibt, wie er "annotierte Präsentationen" erstellt. Dabei handelt es sich um eine Methode, Vorträge nachhaltig aufzubereiten, indem Präsentationsfolien mit erläuternden Texten und weiterführenden Links ergänzt werden.
  • Willison hat dazu ein browserbasiertes Tool entwickelt, mit dem sich annotierte Präsentationen effizient erstellen lassen, unter anderem mit Bild-Uploads, Alt-Texten, Kommentaren und fertig formatiertem HTML-Export. OCR-Funktionen sind ebenfalls integriert.
  • Er ist überzeugt, dass sowohl Vortragende als auch Zuhörer von der verlängerten Lebensdauer und dem Mehrwert der Präsentationen profitieren.
Quellen
Jonathan ist Technikjournalist und beschäftigt sich stark mit Consumer Electronics. Er erklärt seinen Mitmenschen, wie KI bereits heute nutzbar ist und wie sie im Alltag unterstützen kann.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!