Semgrep a évalué des modèles open-weight sur un benchmark de détection d’IDOR, et GLM 5.2 de Zhipu AI atteint 39% de F1, devançant Claude Code (32%) à environ 0,17 $ par vulnérabilité détectée. Ce modèle MoE de 750 milliards de paramètres (40B actifs par token) tourne sous licence MIT avec une fenêtre de contexte d’1M tokens. L’expérience visait à mesurer la part de performance apportée par le modèle seul versus le harness d’orchestration, le pipeline multimodal Semgrep atteignant lui 53–61% de F1 grâce à son scaffolding dédié.
Commentaires
Vous devez
vous inscrire
ou
vous connecter
pour poster un commentaire