Neue KI-Methode erkennt Phishing-E-Mails mit 96 Prozent Genauigkeit

5. Dezember 2024

Midjourney prompted by THE DECODER

Forscher der Hochschule Kaiserslautern haben eine neue Methode entwickelt, die mithilfe von Open Source Sprachmodellen Phishing-E-Mails erkennt. Der Ansatz kombiniert zwei KI-Techniken und erreicht damit deutlich bessere Ergebnisse als bisherige Verfahren.

Laut einer neuen Studie der Hochschule Kaiserslautern lassen sich Phishing-E-Mails mit einer Genauigkeit von bis zu 96 Prozent automatisch erkennen.

"Phishing ist eine der größten Bedrohungen für die Cybersicherheit. Schätzungen zufolge haben 90 Prozent aller erfolgreichen Cyberangriffe Phishing als initialen Angriffsvektor", schreiben die Wissenschaftler in ihrer Studie. Die Forscher kombinierten dafür zwei KI-Techniken: Few-Shot Learning und Retrieval-Augmented Generation (RAG).

Few-Shot Learning bedeutet hier, dass dem KI-Modell einige wenige Beispiele für Phishing-Mails als Kontext mitgegeben werden. Das Modell lernt so, worauf es achten muss, ohne neu trainiert zu werden. Die RAG-Komponente wählt diese Beispiele dynamisch aus: Für jede zu prüfende E-Mail sucht sie in einer Datenbank nach den fünf ähnlichsten bekannten Phishing-Mails. Diese werden dann als Kontext verwendet.

Die Forscher testeten ihre Methode mit elf verschiedenen Open Source Sprachmodellen, darunter Mixtral 8x7B, Llama 3.1 und die neue Gemma-Familie von Google DeepMind. Dabei zeigte sich, dass die Kombination aus Few-Shot Learning und RAG besonders bei größeren Modellen die Erkennungsrate deutlich verbessert.

Kleine Modelle überraschen mit guter Leistung

Das beste Ergebnis erzielte das große Llama 3.1 70B Modell mit einer Genauigkeit von 96,18 Prozent. Überraschend gut schnitt aber auch das deutlich kleinere Gemma2 9B ab, das eine nahezu gleich hohe Genauigkeit von 95 Prozent erreichte. Kleinere Modelle mit weniger als 10 Milliarden Parametern hätten allerdings Schwierigkeiten, die RAG-Methode effektiv zu nutzen.

Für ihre Tests nutzten die Forscher einen ausgewogenen Datensatz aus jeweils 2.900 legitimen und Phishing-E-Mails. Die Phishing-Mails stammten aus realen Angriffen der Jahre 2022 bis 2024. Die legitimen E-Mails kamen aus dem öffentlich verfügbaren CSDMC Spam Corpus.

Die Forscher sehen noch Potenzial für Verbesserungen: Künftig könnten zusätzliche Datenquellen eingebunden und auch E-Mail-Metadaten sowie Dateianhänge berücksichtigt werden. Auch der Einsatz von KI-Agenten, die auf APIs zugreifen können, sei eine vielversprechende Erweiterung.

KI-News ohne Hype – von Menschen kuratiert

Mit dem THE‑DECODER‑Abo liest du werbefrei und wirst Teil unserer Community: Diskutiere im Kommentarsystem, erhalte unseren wöchentlichen KI‑Newsletter, 6× im Jahr den „KI Radar"‑Frontier‑Newsletter mit den neuesten Entwicklungen aus der Spitze der KI‑Forschung, bis zu 25 % Rabatt auf KI Pro‑Events und Zugriff auf das komplette Archiv der letzten zehn Jahre.

KI-News ohne Hype
Von Menschen kuratiert.

Mehr als 20 Prozent Launch-Rabatt.
Lesen ohne Ablenkung – keine Google-Werbebanner.
Zugang zum Kommentarsystem und Austausch mit der Community.
Wöchentlicher KI-Newsletter.
6× jährlich: „KI Radar“ – Deep-Dives zu den wichtigsten KI-Themen.
Bis zu 25 % Rabatt auf KI Pro Online-Events.
Zugang zum kompletten Archiv der letzten zehn Jahre.
Die neuesten KI‑Infos von The Decoder – klar und auf den Punkt.

The Decoder abonnieren

Neue KI-Methode erkennt Phishing-E-Mails mit 96 Prozent Genauigkeit

Kleine Modelle überraschen mit guter Leistung

KI-News ohne Hype – von Menschen kuratiert

KI-News ohne HypeVon Menschen kuratiert.

KI-News ohne Hype
Von Menschen kuratiert.