L'empreinte carbone des LLMs

jpbelval, lundi 31 mars 2025 à 23h28
Modifié

Bonjour,

En réponse aux nombreux articles que j’ai lu sur le sujet et à une certaine curiosité personnelle, j’ai décidé de faire des recherches sur les émissions de carbone des LLMs. Le texte se veut davantage descriptif que prescriptif et j’aimerais que vous validiez la qualité des sources, la forme du texte et la pertinence générale de l’article. N’hésitez pas à me partager vos commentaires!

À présent, c’est à vous !

Merci !

31/03/25 à 23h28
Modifié

+1 -0

jpbelval, lundi 31 mars 2025 à 23h46

Bonjour les agrumes !

La bêta a été mise à jour et décante sa pulpe à l’adresse suivante :

L’empreinte carbone des LLMs

Merci d’avance pour vos commentaires.

31/03/25 à 23h46

+0 -0

jpbelval, mardi 01 avril 2025 à 00h17

Bonjour les agrumes !

La bêta a été mise à jour et décante sa pulpe à l’adresse suivante :

L’empreinte carbone des LLMs

Merci d’avance pour vos commentaires.

01/04/25 à 00h17

+0 -0

luxera, mardi 01 avril 2025 à 10h04

Salut,

J’ai lu un peu en diagonale, et il y a quelques choses qui me posent déjà question :

Es-tu certain de tes 0.63 T eqCO2 pour les GPU ? En faisant le calcul avec les chiffres que tu donnes (et qui sont bien cohérents avec ta première référence) je trouve 625 T, donc un facteur 1000. Ceci dit la conclusion ne devrait pas fondamentalement changer.
Comment justifies-tu la durée de vie de 6 ans et le taux d’utilisation de 85% ? Est-ce que tu as des données ou c’est une hypothèse que tu juges raisonnable ?
Est-ce qu’utiliser le TDP des GPU est vraiment suffisant pour estimer la consommation électrique des serveurs ? Il y a d’autres points de consommation, notamment l’infrastructure réseau et le refroidissement (sans compter les CPU et le stockage). Sur ce point par exemple, une étude sur Grid5000 montre que la consommation en charge des composants "de calcul" n’explique pas toute la consommation.

01/04/25 à 10h04

Science sans explosion n’est que ruine de l’âme

+1 -0

jpbelval, mardi 01 avril 2025 à 17h22

Merci pour ton retour!

En effet il y a un facteur de 1000 qui s’est perdu. Probablement une erreur d’unité de ma part.
C’est une valeur qui a été fournie par l’IDRIS pour leur supercluster lors de l’étude de cette source: https://arxiv.org/pdf/2211.02001 .
Tu as raison qu’une ACV robuste analyserait l’ensemble de la consommation des datacenters. Cependant, je n’ai pas pu trouver de données fiables sur l’ensemble de l’infrastructure. J’ai donc préféré simplifier les estimations plutôt que de les rendre davantage approximatives. Pour ce qui est du CPU, stockage et de la RAM, dans le cas de BLOOM:

[…] 22.7% was consumed by the RAM (207.2 kWh), 2% by the CPU (18.5 kWh) and 75.3% by the GPU (688.38 kWh).

Je l’ai omis, car la majorité de la consommation provient du GPU et c’est le composant sur lequel je me suis concentré (en posant A100 comme le GPU utilisé) durant l’ensemble de l’article. Ceci dit, je devrais probablement ajouter la RAM, car j’ai un 23% en angle mort.

01/04/25 à 17h22

+0 -0

Gawaboumga, il y a 18 heures

Dans les questions que je me suis posées :

Est-ce qu’il existe une estimation du coût lié à la collecte des données servant à l’entraînement ?
De même pour les usages RAG vs Elastic Search
Comparaison avec un autre secteur (retail ?)
Croissance du secteur
Impact du CoT / reasoning

Je vais voir avec ma collègue spécialiste en questions de sobriété numérique pour voir si elle a des remarques supplémentaires.

il y a 18 heures

+1 -0

tleb, il y a 12 heures
Modifié

Salut, sujet intéressant. Une surprise sur les nombres :

Niveau émission de fabrication, tu indiques $25$ kg (de CO2eq) par GPU selon ta source (1) et $2500$ kg par serveur selon ta source (2). Ça fait $8 \times 25=200$ kg pour les GPU d’un serveur versus $2500$ kg.

Le rapport émission des GPU sur émission du reste me parait peu élevé pour des machines spécifiques à cet usage. Ça fait uniquement $\frac {8 \times 25} {8 \times 25+2500} = \frac {200} {2700} \approx 7.4\%$

La source (1) ne donne pas de valeur pour l'embodied carbon des super-ordinateurs (je n’ai vu que des graphes qui donnent une distribution du footprint global par type de produit, mais ils n’expliquent pas leur calcul). Franchement, de ce que j’ai vu, ça ressemble à du calcul à la louche qui n’est pas justifié.

Si on prend l’émission globale de Nvidia sur 2024 divisée par une estimation du nombre de GPU vendues globalement, ça donne $\frac {14390e9} {251e6} \approx 57300$ kgCO2eq. J’ai pris le scope 1, qui est défini comme :

Scope 1 covers emissions from sources that an organisation owns or controls directly – for example from burning fuel in our fleet of vehicles (if they’re not electrically-powered).

https://www.nationalgrid.com/stories/energy-explained/what-are-scope-1–2-3-carbon-emissions

Il semblerait même envisageable d’utiliser le scope 3 (inclut les émissions des sous-traitants), qui est 253 fois le scope 1. La logique est : si Nvidia vendait 0 GPU (ie Nvidia n’existait pas), alors l’intégralité de leurs émissions serait nulle, ainsi que celle de leurs sous-traitants ; on peut donc distribuer ces émissions ~linéairement à chaque GPU.

On est à 3/6 ordres de grandeur de l’estimation de ta source (1). Il y a sûrement un juste milieu.

Bref, les nombres d’émissions liés à la fabrication me semblent étrangement bas et je n’ai pas de solution pour avoir des nombres fiables.

il y a 12 heures
Modifié

Carte des membres

+0 -0

De la conception jusqu'au déploiement

Pas encore membre ?