Große Sprachmodelle in Form von Chatbots sind im Wesentlichen eine neue Computerschnittstelle. PrivateGPT zeigt, wie diese auf eigene Dateien angewendet werden kann.
Große Sprachmodelle von Firmen wie Microsoft oder OpenAI können Inhalte in Dokumenten erfassen und "chatbar" machen, d.h. ein Gespräch über die Inhalte führen, Details erklären oder Aussagen interpretieren, Zusammenfassungen generieren, neue Inhalte daraus ableiten und so weiter. Das kann beim Recherchieren und Verstehen helfen und ist, wenn es zuverlässig funktioniert, eine revolutionäre neue Art, mit Computern und Inhalten umzugehen.
Die Sache hat allerdings einen Haken: Die Chatbots der großen Tech-Firmen müssen dazu ihre eigenen Dokumente lesen. Aus Datenschutzgründen möchte man das vielleicht vermeiden. Eine mögliche Alternative kommt aus der Open-Source-Bewegung: PrivateGPT, ein lokaler Dokumenten-Chatbot.
PrivateGPT macht lokale Dateien Chatfähig
Das Open-Source-Projekt macht Chatbot-Gespräche über eigene Dateien lokal möglich. Man kann Dateien in das System eingeben und ohne Internetverbindung Gespräche über den Inhalt der Dateien führen und diese im Dialog analysieren. Alle Daten werden komplett lokal verarbeitet. Die Software unterstützt derzeit zwölf Dateiformate über LangChain, darunter Powerpoint, Word, PDF und HTML.
PrivateGPT verwendet GPT4ALL, einen nach der Alpaca-Formel trainierten lokalen Chatbot, der wiederum auf einer mit 430.000 GPT-3.5-Turbo-Outputs feingetunten LLaMA-Variante basiert. Alternativ können andere lokal ausführbare Open-Source-Sprachmodelle wie Camel integriert werden.
Unternehmen könnten eine Anwendung wie PrivateGPT beispielsweise für das interne Wissensmanagement, im Kundenservice oder auch zur Erstellung von Kommunikationsvorlagen aus eigenen Daten nutzen, ohne Dritten Zugriff auf die eigenen Daten zu gewähren.
Alle notwendigen Dateien und eine Installationsanleitung für PrivateGPT sind auf Github verfügbar. Eine Videoanleitung zur Installation ist bei Matthew Berman verfügbar. Zusätzlich ist mit PrivateGPT-App ein Web-Interface in Arbeit, die als visuelle Schnittstelle zu PrivateGPT dient.