Magika est un outil open source de Google pour détecter le type de contenu de fichiers via un modèle de deep learning optimisé (~quelques Mo). Entraîné sur ~100M de fichiers couvrant 200+ types de contenu, il atteint ~99% de précision avec une inférence d’environ 5ms par fichier sur CPU. Disponible en CLI Rust, package Python (pip install magika), JavaScript/TypeScript et Go, il est déjà utilisé en production chez Google pour scanner les fichiers Gmail, Drive et Safe Browsing.
Commentaires
Vous devez
vous inscrire
ou
vous connecter
pour poster un commentaire