L'empreinte carbone des LLMs

De la conception jusqu'au déploiement

a marqué ce sujet comme résolu.

Bonjour, :D

En réponse aux nombreux articles que j’ai lu sur le sujet et à une certaine curiosité personnelle, j’ai décidé de faire des recherches sur les émissions de carbone des LLMs. Le texte se veut davantage descriptif que prescriptif et j’aimerais que vous validiez la qualité des sources, la forme du texte et la pertinence générale de l’article. N’hésitez pas à me partager vos commentaires!

Merci !

+1 -0

Salut,

J’ai lu un peu en diagonale, et il y a quelques choses qui me posent déjà question :

  • Es-tu certain de tes 0.63 T eqCO2 pour les GPU ? En faisant le calcul avec les chiffres que tu donnes (et qui sont bien cohérents avec ta première référence) je trouve 625 T, donc un facteur 1000. Ceci dit la conclusion ne devrait pas fondamentalement changer.
  • Comment justifies-tu la durée de vie de 6 ans et le taux d’utilisation de 85% ? Est-ce que tu as des données ou c’est une hypothèse que tu juges raisonnable ?
  • Est-ce qu’utiliser le TDP des GPU est vraiment suffisant pour estimer la consommation électrique des serveurs ? Il y a d’autres points de consommation, notamment l’infrastructure réseau et le refroidissement (sans compter les CPU et le stockage). Sur ce point par exemple, une étude sur Grid5000 montre que la consommation en charge des composants "de calcul" n’explique pas toute la consommation.
+1 -0

Merci pour ton retour!

  1. En effet il y a un facteur de 1000 qui s’est perdu. Probablement une erreur d’unité de ma part.
  2. C’est une valeur qui a été fournie par l’IDRIS pour leur supercluster lors de l’étude de cette source: https://arxiv.org/pdf/2211.02001 .
  3. Tu as raison qu’une ACV robuste analyserait l’ensemble de la consommation des datacenters. Cependant, je n’ai pas pu trouver de données fiables sur l’ensemble de l’infrastructure. J’ai donc préféré simplifier les estimations plutôt que de les rendre davantage approximatives. Pour ce qui est du CPU, stockage et de la RAM, dans le cas de BLOOM:

    […] 22.7% was consumed by the RAM (207.2 kWh), 2% by the CPU (18.5 kWh) and 75.3% by the GPU (688.38 kWh).

Je l’ai omis, car la majorité de la consommation provient du GPU et c’est le composant sur lequel je me suis concentré (en posant A100 comme le GPU utilisé) durant l’ensemble de l’article. Ceci dit, je devrais probablement ajouter la RAM, car j’ai un 23% en angle mort.

Dans les questions que je me suis posées :

  • Est-ce qu’il existe une estimation du coût lié à la collecte des données servant à l’entraînement ?
  • De même pour les usages RAG vs Elastic Search
  • Comparaison avec un autre secteur (retail ?)
  • Croissance du secteur
  • Impact du CoT / reasoning

Je vais voir avec ma collègue spécialiste en questions de sobriété numérique pour voir si elle a des remarques supplémentaires.

Salut, sujet intéressant. Une surprise sur les nombres :

Niveau émission de fabrication, tu indiques 2525 kg (de CO2eq) par GPU selon ta source (1) et 25002500 kg par serveur selon ta source (2). Ça fait 8×25=2008 \times 25=200 kg pour les GPU d’un serveur versus 25002500kg.

Le rapport émission des GPU sur émission du reste me parait peu élevé pour des machines spécifiques à cet usage. Ça fait uniquement 8×258×25+2500=20027007.4%\frac {8 \times 25} {8 \times 25+2500} = \frac {200} {2700} \approx 7.4\%

La source (1) ne donne pas de valeur pour l'embodied carbon des super-ordinateurs (je n’ai vu que des graphes qui donnent une distribution du footprint global par type de produit, mais ils n’expliquent pas leur calcul). Franchement, de ce que j’ai vu, ça ressemble à du calcul à la louche qui n’est pas justifié.


Si on prend l’émission globale de Nvidia sur 2024 divisée par une estimation du nombre de GPU vendues globalement, ça donne 14390e9251e657300\frac {14390e9} {251e6} \approx 57300 kgCO2eq. J’ai pris le scope 1, qui est défini comme :

Scope 1 covers emissions from sources that an organisation owns or controls directly – for example from burning fuel in our fleet of vehicles (if they’re not electrically-powered).

https://www.nationalgrid.com/stories/energy-explained/what-are-scope-1–2-3-carbon-emissions

Il semblerait même envisageable d’utiliser le scope 3 (inclut les émissions des sous-traitants), qui est 253 fois le scope 1. La logique est : si Nvidia vendait 0 GPU (ie Nvidia n’existait pas), alors l’intégralité de leurs émissions serait nulle, ainsi que celle de leurs sous-traitants ; on peut donc distribuer ces émissions ~linéairement à chaque GPU.

On est à 3/6 ordres de grandeur de l’estimation de ta source (1). Il y a sûrement un juste milieu.


Bref, les nombres d’émissions liés à la fabrication me semblent étrangement bas et je n’ai pas de solution pour avoir des nombres fiables.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte