Une réécriture de SQLite en Rust générée par LLM compile, passe les tests et supporte le format de fichier SQLite, mais s’avère 20 000 fois plus lente sur des requêtes basiques. L’analyse montre que les LLM optimisent pour la plausibilité plutôt que la correctness : le code semble fonctionnel mais échoue sous scrutin. Un cas d’étude qui illustre l’importance de définir des critères d’acceptation clairs avant de générer du code avec les LLM.

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire