Inhalt
summary Zusammenfassung

Google stellt mit Magika ein KI-System zur Erkennung von Dateitypen als Open Source zur Verfügung. Es kann binäre und textbasierte Dateitypen schnell und genau erkennen.

Die genaue Erkennung von Dateitypen ist aufgrund der unterschiedlichen Strukturen von Dateiformaten ein schwieriges Problem.

Herkömmliche Erkennungswerkzeuge wie libmagic verlassen sich auf handgemachte Heuristiken und benutzerdefinierte Regeln, die zeitaufwendig und fehleranfällig sein können.

Magika geht diese Probleme mit seinem KI-basierten Modell und seinem großen Trainingsdatensatz an. Es bietet laut Google eine zuverlässigere Methode zur Erkennung von Dateitypen in großem Maßstab.

Anzeige
Anzeige

Magika verwendet ein benutzerdefiniertes Deep-Learning-Modell, das nur 1 MB groß ist und Dateien innerhalb von Millisekunden identifizieren kann, schreibt Google.

In einem Benchmark mit einer Million Dateien übertrifft Magika bestehende Tools um 20 Prozent, bei Textdateien ist die Leistung noch höher.

Magika erzielt bei der Dateierkennung fast perfekte Werte. | Bild: Google

Intern verwendet Google Magika nach eigenen Angaben, um Gmail-, Drive- und Safe Browsing-Dateien an die richtigen Sicherheits- und Inhaltsrichtlinien-Scanner weiterzuleiten.

Der Open-Source-Ansatz von Magika zielt darauf ab, andere Software bei der Verbesserung der Genauigkeit ihrer Dateierkennung zu unterstützen und Forschern ein zuverlässiges Werkzeug für die Erkennung in großem Maßstab zur Verfügung zu stellen.

Die bevorstehende Integration von Magika mit VirusTotal soll die Effizienz und Genauigkeit der Plattform bei der Erkennung von bösartigem Code verbessern.

Empfehlung

Benutzer können die Web-Demo von Magika ausprobieren oder es als Python-Bibliothek und eigenständiges Kommandozeilen-Tool installieren.

Magika ist auf Github unter der Apache2-Lizenz verfügbar und kann als eigenständiges Dienstprogramm und als Python-Bibliothek über den Paketmanager pypi mit dem Befehl "pip install magika" installiert werden.

Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Anzeige
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!
Unterstütze unsere unabhängige, frei zugängliche Berichterstattung. Jeder Betrag hilft und sichert unsere Zukunft. Jetzt unterstützen:
Banküberweisung
Zusammenfassung
  • Google hat mit Magika ein KI-basiertes System zur Erkennung von Dateitypen als Open Source veröffentlicht, das binäre und textbasierte Dateitypen schnell und genau identifizieren kann.
  • Im Vergleich zu herkömmlichen Erkennungswerkzeugen, die auf handgemachten Heuristiken und benutzerdefinierten Regeln basieren, verwendet Magika ein Deep-Learning-Modell und einen großen Trainingsdatensatz, um eine zuverlässigere Erkennung zu gewährleisten.
  • Magika wird bereits intern bei Google eingesetzt und soll anderen Softwareanwendungen helfen, ihre Dateierkennungsgenauigkeit zu verbessern, und Forschern ein zuverlässiges Werkzeug für die Erkennung in großem Maßstab an die Hand geben.
Quellen
Online-Journalist Matthias ist Gründer und Herausgeber von THE DECODER. Er ist davon überzeugt, dass Künstliche Intelligenz die Beziehung zwischen Mensch und Computer grundlegend verändern wird.
Community beitreten
Kommt in die DECODER-Community bei Discord,Reddit, Twitter und Co. - wir freuen uns auf euch!