GLM 5.2 surpasse Claude sur la détection d'IDOR sans harness (en)

Semgrep a évalué des modèles open-weight sur un benchmark de détection d’IDOR, et GLM 5.2 de Zhipu AI atteint 39% de F1, devançant Claude Code (32%) à environ 0,17 $ par vulnérabilité détectée. Ce modèle MoE de 750 milliards de paramètres (40B actifs par token) tourne sous licence MIT avec une fenêtre de contexte d’1M tokens. L’expérience visait à mesurer la part de performance apportée par le modèle seul versus le harness d’orchestration, le pipeline multimodal Semgrep atteignant lui 53–61% de F1 grâce à son scaffolding dédié.

https://semgrep.dev/blog/2026/we-have-mythos-at-home-glm-52-beats-claude-in-o...

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire

GLM 5.2 surpasse Claude sur la détection d'IDOR sans harness (en)

Commentaires

Prochaines formations

Rejoignez notre Discord