Alors que l’explosion de l’intelligence artificielle fait grimper la consommation électrique des centres de données à des niveaux inédits, NVIDIA propose une approche qui semble contre-intuitive : utiliser un liquide de refroidissement beaucoup plus chaud que la norme. Derrière cette idée se cache pourtant l’un des enjeux majeurs de la prochaine décennie pour l’industrie de l’IA.
Pourquoi un liquide plus chaud permet de consommer moins
Le raisonnement repose sur un principe thermodynamique relativement simple. Aujourd’hui, une grande partie de l’énergie consommée par les centres de données ne sert pas à faire fonctionner les processeurs, mais à les refroidir. Maintenir un écart important entre la température des serveurs et celle de l’environnement nécessite des systèmes de climatisation, des groupes froids et des infrastructures particulièrement gourmandes en électricité.
En acceptant un liquide de refroidissement à 45 °C, NVIDIA va réduire cet écart thermique. Ainsi les systèmes de refroidissement ont moins d’efforts à fournir et consomment moins d’énergie. À l’échelle d’un centre de données comptant des dizaines de milliers de GPU, l’économie peut devenir considérable.
L’IA est en train de transformer les data centers en centrales électriques
Cette évolution n’arrive pas par hasard. Les puces H100, H200 ou les futures Blackwell de NVIDIA affichent des consommations qui n’ont plus grand-chose à voir avec celles des générations précédentes. Certaines dépassent désormais les 700 watts par processeur lorsqu’elles entraînent des modèles d’IA.
Le refroidissement par air atteint progressivement ses limites, d'où des projets dans l'espace ou les océans. Pour évacuer une telle quantité de chaleur, il faudrait des flux d’air gigantesques, des ventilateurs toujours plus puissants et une consommation énergétique supplémentaire difficilement soutenable. Le refroidissement liquide s’impose donc progressivement comme la nouvelle norme dans les centres de données dédiés à l’intelligence artificielle.
Un enjeu stratégique pour OpenAI, Meta et Anthropic
Cette annonce intervient alors que les géants de l’IA multiplient les investissements dans de nouvelles infrastructures. Les modèles d’OpenAI, d’Anthropic, de Meta ou encore de xAI nécessitent désormais des fermes de calcul gigantesques où des dizaines de milliers de GPU tournent en permanence pendant plusieurs jours, voire plusieurs semaines.
Le principal frein n’est plus seulement la disponibilité des puces NVIDIA. L’accès à l’électricité et la capacité à refroidir efficacement ces installations deviennent des contraintes tout aussi importantes. Selon plusieurs estimations, la consommation énergétique des centres de données pourrait être multipliée par trois d’ici 2030 sous l’effet de l’IA générative.
Qu’en penser ?
Si cette approche s’impose, elle pourrait modifier profondément la conception des futurs data centers. Des températures de fonctionnement plus élevées permettraient d’utiliser davantage l’air ambiant pour évacuer la chaleur, de simplifier certaines infrastructures et même d’implanter des centres de calcul dans des régions jusqu’ici moins favorables. Mais pour y parvenir, l’ensemble de l’écosystème devra suivre : fabricants de serveurs, exploitants de centres de données, systèmes de distribution de liquide et normes industrielles.
Depuis deux ans, l’attention se concentre principalement sur les performances des modèles d’IA et sur la course aux GPU. Pourtant, l’avenir de l’industrie dépend tout autant de sa capacité à résoudre un problème beaucoup plus terre-à-terre : la consommation électrique.
En proposant des serveurs capables de fonctionner avec un liquide de refroidissement à 45 °C, NVIDIA ne cherche pas seulement à améliorer quelques pourcents d’efficacité. Le groupe tente d’anticiper le prochain goulot d’étranglement de l’intelligence artificielle. Car si les besoins de calcul continuent de croître au rythme actuel, ce ne seront bientôt plus les puces qui manqueront, mais l’énergie nécessaire pour les faire tourner.