L'industrie de l'IA en plein essor consomme d'énormes quantités de puces mémoire informatiques, du même type que celles utilisées dans les ordinateurs portables, les smartphones et les consoles de jeux. Cela a entraîné une hausse des prix et des pénuries potentielles pour les produits grand public. Les fabricants font face à des défis pour augmenter leur production face à la demande croissante.
Les modèles d'intelligence artificielle nécessitent d'énormes quantités de mémoire en raison de leur échelle, composés de milliards ou de trillions de paramètres stockés en RAM pour permettre un traitement rapide des données et éviter les goulots d'étranglement dus à des stockages plus lents comme les disques durs. Ces modèles fonctionnent à des échelles massives, supportant des centaines, des milliers ou des millions d'utilisateurs simultanés, alimentés par des investissements illimités.
La production de semi-conducteurs est limitée par les capacités des usines, les nouvelles installations nécessitant des années et des investissements massifs pour être construites. Samsung Electronics et SK Hynix, qui produisent environ 70 % de ces puces, hésitent à augmenter significativement l'offre, craignant un ralentissement de l'industrie de l'IA qui pourrait laisser les usines inactives. Samsung a profité de la demande en augmentant les prix, par exemple, une puce de 32 gigaoctets passant de 149 $ en septembre à 239 $ en novembre, soit une hausse de 60 %.
Des pénuries similaires se sont produites auparavant. En 2021, une crise mondiale des puces, aggravée par la pandémie, les guerres commerciales, les incendies, les sécheresses et les tempêtes de neige, a perturbé la fabrication des camions aux micro-ondes. Cette année-là a également vu des pénuries de disques durs dues à l'essor de la cryptomonnaie Chia. Le boom de l'IA a de même accaparé les unités de traitement graphique, faisant passer le cours de l'action Nvidia de 13 $ au début de 2021 à plus de 200 $ récemment.
OpenAI a conclu des accords avec Samsung et SK Hynix pour environ 40 % de l'approvisionnement mondial en mémoire, tandis que Microsoft, Google et ByteDance acquièrent également des puces de manière agressive. L'équilibre pourrait ne pas arriver avant 2028, sauf si un effondrement de l'IA intervient, pouvant causer des retombées économiques. L'analyste sectoriel Sanchit Vir Gogia de Greyhound Research a averti Reuters que « la pénurie de mémoire est passée d'une préoccupation au niveau des composants à un risque macroéconomique ».