Les jointures SQL ne sont pas coûteuses : benchmark dimensionnel vs One Big Table (en)

Idée reçue répandue dans l’écosystème Data Lake : les jointures SQL seraient trop coûteuses en CPU, justifiant l’usage de tables “One Big Table” (OBT) pré-jointes. Cet article met en place un benchmark comparatif entre un modèle dimensionnel classique (sales + product) et une table OBT aplatie sur 1 milliard de lignes, en utilisant DuckDB. Les résultats remettent en cause l’hypothèse selon laquelle sacrifier de l’espace disque permet d’économiser du CPU au moment de la lecture.

https://www.database-doctor.com/posts/joins-are-not-expensive

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire

Les jointures SQL ne sont pas coûteuses : benchmark dimensionnel vs One Big Table (en)

Commentaires

Prochaines formations

Rejoignez notre Discord