Anthropic vient de sortir l’auto mode pour Claude Code, une alternative aux confirmations manuelles basée sur des classifieurs IA. L’architecture combine un probe de détection d’injection de prompt côté serveur et un classifieur de transcript (Sonnet 4.6) évaluant chaque action avant exécution. Le système cible les comportements overeager, les erreurs de périmètre et les injections de prompt, avec des cas concrets comme la suppression de branches distantes ou l’exfiltration de credentials.
Commentaires
Vous devez
vous inscrire
ou
vous connecter
pour poster un commentaire