L’analyse du modèle Mythos d’Anthropic par l’AI Security Institute révèle une nouvelle réalité : sécuriser un système revient à dépenser plus de tokens pour trouver des exploits que les attaquants n’en dépensent pour en exploiter. Le benchmark “The Last Ones” simule une attaque réseau complexe en 32 étapes — seul Mythos l’a complétée, dans 3 tentatives sur 10, avec un budget de 100M tokens chacune. L’article propose un cycle de développement en trois phases : développement, revue de code, puis hardening autonome limité par le budget.

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire