OpenAI franchit une étape stratégique : l'entreprise et Broadcom ont annoncé une puce d'intelligence artificielle « maison », baptisée selon plusieurs médias « Jalapeño », un accélérateur conçu pour l'inférence — l'exécution des modèles en temps réel quand un utilisateur interroge ChatGPT.
Une puce dédiée à l'inférence
Le composant est un ASIC (circuit intégré spécialisé), passé du concept à l'envoi en fabrication en un cycle de développement très court, rapporte Tom's Hardware. Il serait fabriqué chez TSMC (nœud de gravure À VÉRIFIER), Broadcom apportant son expertise réseau. OpenAI revendique une réduction d'environ 50 % du coût par token d'inférence par rapport aux GPU Nvidia actuels, selon TechCrunch (chiffre à confirmer de façon indépendante). Les GPU Nvidia resteraient toutefois nécessaires pour l'entraînement des grands modèles ; Jalapeño cible la seule inférence, là où les coûts d'exploitation quotidiens sont les plus lourds.
Une stratégie de verticalisation
L'accord dépasse la seule puce : OpenAI et Broadcom évoquent un déploiement de l'ordre de 10 gigawatts de capacité de calcul d'ici 2029, avec Microsoft et d'autres partenaires (chiffres À VÉRIFIER). En concevant ses propres puces, OpenAI suit la voie tracée par Google (TPU), Amazon (Trainium) ou Microsoft (Maia) : maîtriser le silicium pour sécuriser ses capacités face à la pénurie de GPU et à la domination de Nvidia.
Souveraineté : l'Europe spectatrice
Cette course soulève une question pour l'Europe. Jalapeño serait conçu aux États-Unis, fabriqué à Taïwan et déployé dans des centres de données américains — hors de toute empreinte industrielle européenne. La France et ses partenaires n'ont pas de champion comparable dans la conception d'ASIC d'IA à cette échelle, malgré le plan « chips » européen. Chaque requête d'un utilisateur français s'appuie ainsi sur une chaîne de valeur — conception, fabrication, déploiement — qui échappe largement au continent, ravivant le débat sur la souveraineté numérique.



