Das Open-Source-Projekt Perplexica will mit LLMs und KI-Funktionen eine datenschutzfreundliche Alternative zu proprietären KI-Suchmaschinen wie Perplexity AI bieten.
Perplexica verwendet nach eigenen Angaben umfangreiche Sprachmodelle in Kombination mit Algorithmen des maschinellen Lernens wie Ähnlichkeitssuche und Einbettung, um Suchergebnisse zu verfeinern und eindeutige Antworten mit Quellenangaben zu liefern.
Die Architektur von Perplexica besteht aus mehreren Schlüsselkomponenten: einer webbasierten Benutzeroberfläche, Agenten und Ketten zur Vorhersage der nächsten Schritte, SearXNG für die Websuche, großen Sprachmodellen (LLMs) zum Verstehen von Inhalten und zum Schreiben von Antworten sowie Embedding-Modellen zur Neuanordnung von Suchergebnissen.
Der Prozess läuft wie folgt ab: Die Benutzeranfrage wird an den Backend-Server gesendet, wo die Suchkette ausgelöst wird. Dort wird festgestellt, ob eine Websuche erforderlich ist. Ist das der Fall, wird im normalen Modus eine Suchanfrage an SearXNG gesendet.
Die Ergebnisse werden in Embeddings umgewandelt und einer Ähnlichkeitssuche unterzogen, um die relevantesten Quellen zu finden. Diese werden an den Antwortgenerator übergeben, der eine Antwort generiert und an die Benutzerschnittstelle sendet. Das Zitieren der Quellen erfolgt durch die Sprachmodelle selbst.
Perplexica bietet verschiedene Hauptmodi: Im "Copilot-Modus" (noch in Entwicklung) sollen durch die Generierung verschiedener Suchanfragen relevantere Internetquellen gefunden werden. Der "Normal Mode" verarbeitet die Suchanfrage und führt eine Websuche durch.
Darüber hinaus bietet Perplexica sechs Fokusmodi, die auf die optimale Beantwortung bestimmter Fragetypen ausgerichtet sind: Dazu gehören ein "All Mode" für die breite Websuche, ein "Writing Assistant" für Schreibaufgaben, eine "Academic Search" für wissenschaftliche Recherchen, eine "YouTube Search" für Videos, eine "Wolfram Alpha Search" für Berechnungen und Datenanalysen sowie eine "Reddit Search" für Diskussionen und Meinungen.
Die Installation von Perplexica erfolgt vorzugsweise über Docker, geht aber auch ohne. Eine Schritt-für-Schritt-Anleitung findet sich in der Installationsdokumentation. Perplexica kann auch als alternative Suchmaschine in Browsern eingerichtet werden.