Un LLM ne produit pas du code correct mais du code plausible (en)

Une réécriture de SQLite en Rust générée par LLM compile, passe les tests et supporte le format de fichier SQLite, mais s’avère 20 000 fois plus lente sur des requêtes basiques. L’analyse montre que les LLM optimisent pour la plausibilité plutôt que la correctness : le code semble fonctionnel mais échoue sous scrutin. Un cas d’étude qui illustre l’importance de définir des critères d’acceptation clairs avant de générer du code avec les LLM.

https://blog.katanaquant.com/p/your-llm-doesnt-write-correct-code

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire

Un LLM ne produit pas du code correct mais du code plausible (en)

Commentaires

Prochaines formations

Rejoignez notre Discord