Article technique expliquant le fonctionnement interne des LLMs modernes, de la tokenisation jusqu’à la prédiction du token suivant. Couvre les mécanismes clés : embeddings, positional encoding, attention, multi-head attention, feed-forward network et residual stream. Une introduction accessible, sans mathématiques, pour comprendre l’architecture transformer et pouvoir lire les papers et model cards des modèles actuels.

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire