Pendant que les géants de la tech dépensent des centaines de milliards pour empiler des GPU Nvidia, un seul homme s'est mis en tête de briser leur monopole depuis son appartement de San Diego. Et le plus inquiétant pour Nvidia, c'est qu'il pourrait y arriver. Son nom est George Hotz, et son arme s'appelle tinygrad.
Un hacker très connu
Être un ado, c'est pas facile.
Connaissez-vous George Hotz ? Pour les plus vieux d’entre vous, ce nom doit être familier. Ou peut-être que son nom de hacker, geohot, vous rappelle de vieux souvenirs. En effet, en 2007, alors qu'il n'avait que 17 ans, il avait réussi à débloquer l’iPhone. À l’époque, le smartphone d’Apple n’était utilisable que sur le réseau AT&T aux USA. Hotz avait réussi à le débloquer seul en quelques semaines. Il avait même fait une vidéo sur YouTube pour montrer comment faire. Il refera cela en direct à la télévision américaine peu après.
Trois ans plus tard, rebelote, mais cette fois-ci avec la PlayStation 3. Alors qu’à sa sortie Sony permet à ses clients d'installer Linux sur sa dernière console, une mise à jour du firmware en 2010 retire cette fonction. La communauté considère cela comme injuste, la console étant vendue avec cette fonctionnalité au départ. George Hotz réussit alors à pirater la console en quelques semaines, alors que tout le monde se cassait les dents dessus depuis des mois. Il publie les clés cryptographiques en ligne, permettant d'exécuter du code non signé et ainsi de faire tourner Linux (et de pirater des jeux, potentiellement). Comme on peut l’imaginer, Sony n'a pas apprécié et l'a attaqué en justice. L’affaire se soldera par un accord à l’amiable.
George Hotz qui teste son boîtier de navigation autonome.
George Hotz croise ensuite le chemin d'Elon Musk, qui le met au défi de créer un logiciel de conduite autonome meilleur que ce qui se trouve sur le marché. C'est un moyen détourné pour essayer de le recruter. Mais Hotz refuse de travailler pour lui et crée sa propre société : comma.ai. Le résultat est un boîtier coûtant 1 500 $ qui peut se brancher sur votre voiture pour la rendre, en partie, autonome. Cela fonctionne étonnamment bien et est compatible aujourd’hui avec plus de 300 véhicules.
Prochaine cible : Nvidia
En novembre 2022, Hotz quitte comma.ai pour s'attaquer à l'IA, plus précisément à Nvidia. Oui, Nvidia, le géant des cartes graphiques, l'entreprise qui tient entre ses mains tous les géants de l'IA. Hotz crée l’entreprise tinycorp dans le but de rendre plus accessible le machine learning. En effet, tous les ordinateurs qui font de l'IA utilisent les puces GPU produites, en majorité, par Nvidia. Or, les GPU d’AMD sont relativement comparables. La différence se fait grâce à CUDA, la couche logicielle fournie par Nvidia. CUDA est utilisé par tout le monde, OpenAI, Anthropic, Meta et autres, pour programmer les frameworks d'IA modernes.
Le but de George Hotz est de libérer les utilisateurs de GPU de la mainmise de Nvidia sur le secteur. Tinygrad peut fonctionner via CUDA, mais aussi Metal (Apple) et HIP/ROCM (AMD). Ainsi, tinygrad, son framework de réseaux neuronaux, permet de faire du machine learning sans dépendre lourdement de PyTorch et de TensorFlow.
D'abord en conflit avec AMD, la société texane décide de travailler avec lui. Cela permet à Hotz de créer la tinybox : un ordinateur avec 6 GPU d'AMD permettant d'entraîner et de faire tourner des modèles d'IA localement pour 15 000 $. Et cela, sans Nvidia.
Le spectre de la bulle
George Hotz n'a pas sa langue dans sa poche. Il dit ce qu'il pense : Nvidia est massivement surévaluée, ou AMD est massivement sous-évaluée. Le matériel est similaire. CUDA n'est pas le moat que les gens pensent. Ainsi, geohot se positionne face à Nvidia et laisse penser qu’une alternative est possible. Non seulement possible, mais surtout beaucoup moins chère.
J'avais déjà abordé dans un précédent article le fait que la bulle de l'IA ferait 17 fois la taille de la bulle internet et 4 fois la taille des subprimes. Et le plus gros bénéficiaire de cette bulle, c'est précisément Nvidia, dont l'action a fait +1600% depuis l'arrivée de ChatGPT fin 2022.
Cette valorisation repose sur une idée simple : Nvidia a un monopole pour les GPU qui sont utilisés par les IA et personne ne peut s’en passer. Or, si des concurrents arrivent à proposer des produits similaires moins chers, tout risque de s’écrouler.
Des ennemis partout
D’ailleurs, un certain nombre d’entreprises commencent déjà à se libérer de l’emprise de Nvidia. Google utilise déjà ses propres TPU. Amazon de son côté a ses puces Trainium. Les travaux de George Hotz vont aussi dans ce sens. Ajoutons à cela l'éventuelle arrivée d'un concurrent chinois. Rappelons que les GPU Nvidia sont interdits à l’exportation vers la Chine. Le gouvernement américain argumente que ce sont des technologies trop stratégiques pour les laisser à l’ennemi asiatique. Les États-Unis veulent ainsi essayer de garder un avantage local sur leurs IA en limitant le développement de l’IA du concurrent chinois.
Cependant, cela a sans doute l’effet inverse. Au lieu de freiner le développement de l’IA en Chine, à cause de la pénurie des meilleurs GPU pour entraîner les modèles, cela force la Chine à développer ses propres solutions. Ne pouvant pas acheter de GPU de dernière génération, les ingénieurs chinois commencent à développer les leurs, comme le Huawei Ascend.
De plus, cela pousse aussi les ingénieurs chinois à entrainer leurs modèles en utilisant moins de puissance brute. Le modèle DeepSeek V3 a refroidi tout le monde de l'IA. Il a été créé avec des coûts d'entraînement estimés aux alentours de 5 millions de dollars. Soit 20 fois moins cher que le modèle concurrent comparable : GPT-4.
Nvidia en danger ?
L’histoire de George Hotz qu'elle illustre d’une certaine manière la fragilité du modèle économique actuel de l'IA. OpenAI dépense des dizaines de milliards en GPU Nvidia pour entrainer des modèles qui ne sont toujours pas rentables (j'en parlais dans cet article). Microsoft a injecté des dizaines de milliards dans OpenAI. Oracle s'engage sur 300 milliards de data centers. Tout cet édifice repose sur l'idée que la puissance de calcul est une ressource rare et chère, contrôlée par un seul acteur.
Mais que se passe-t-il le jour où AMD, Intel, ou même un nouveau venu chinois sort des puces compatibles avec un framework ouvert comme tinygrad, à un quart du prix de Nvidia ? Le créateur de GPU pourrait alors voir sa valorisation boursière s’effondrer. La bulle de l’IA risque alors d’exploser, entraînant avec elle toute l’économie mondiale.
Un air de déjà vu ?
L'histoire de l'informatique nous a déjà appris cette leçon, à de multiples reprises. Les gros systèmes (mainframes) ont été remplacés par les mini-ordinateurs. Les mainframes prenaient la place d'une pièce entière et les mini-ordinateurs étaient gros comme des frigos. Puis les mini-ordinateurs ont été remplacés par les micro-ordinateurs, les PCs d’aujourd’hui. Et maintenant, ce sont les smartphones qui continuent la tradition.
Oui : ce sont des mini-ordinateurs.
Au niveau logiciel, Microsoft pensait avoir un monopole absolu sur les systèmes d'exploitation grâce à Windows, en ayant réussi à évincer IBM et Apple (et d'autres) dans les années 1990. Et cela, jusqu'à ce qu'une personne nommée Linus Torvalds publie un noyau open source depuis sa chambre d'étudiant. Trente ans plus tard, Linux fait tourner la quasi-totalité d'Internet, l'intégralité des supercalculateurs du monde, et même en partie Azure, l'infrastructure cloud de Microsoft. Windows n'est plus le système d'exploitation le plus utilisé par le grand public : c'est désormais Android, qui repose sur un noyau Linux.
Un seul codeur têtu peut changer toute une industrie. George Hotz est peut-être en train d'écrire la même histoire, version 2026, avec le calcul GPU à la place du système d'exploitation.