NVIDIA DGX Spark : un supercalculateur IA sur votre bureau
Une machine grande comme un Mac Mini qui fait tourner des modèles de 200 milliards de paramètres en local. Ce que la DGX Spark change vraiment pour une PME — sans le marketing.
Par Nacim Moudjeb6 min4
Un supercalculateur IA dans une boîte de 1,2 kg
En octobre 2025, NVIDIA a mis en vente une machine qui aurait paru absurde deux ans plus tôt : un ordinateur grand comme un Mac Mini (150 × 150 × 50 mm, 1,2 kg) capable de faire tourner des modèles d'IA que seuls des serveurs de datacenter manipulaient jusque-là. La DGX Spark. Et derrière le buzz, il y a un vrai changement pour qui veut faire de l'IA sans tout envoyer dans le cloud.
Regardons ce que c'est vraiment, et surtout à qui ça sert.
Ce qu'il y a dans la boîte
Les chiffres viennent de la fiche officielle NVIDIA :
Puce GB10 Grace Blackwell : un CPU Arm 20 cœurs et un GPU Blackwell sur la même puce.
128 Go de mémoire unifiée LPDDR5x, partagée entre CPU et GPU — c'est elle qui permet de charger de gros modèles.
Jusqu'à 1 PFLOP (un million de milliards d'opérations/seconde) en précision FP4.
4 To de SSD chiffré, 240 W au mur (ça se branche sur une prise normale).
Réseau ConnectX-7 à 200 Gbit/s, qui permet de relier deux unités.
Système NVIDIA DGX OS (basé sur Linux).
Concrètement : elle fait de l'inférence jusqu'à 200 milliards de paramètres, du fine-tuning jusqu'à 70 milliards, et en reliant deux machines, on atteint des modèles de 405 milliards. Des modèles comme Llama, Qwen, Gemma ou DeepSeek tournent dessus dès la sortie de carton.
Le prix, qui a bougé
Annoncée à 2 999 $ au CES en janvier 2025, elle est sortie à 3 999 $ le 15 octobre 2025, puis a grimpé à 4 699 $ sur le NVIDIA Marketplace début 2026. Elle est aussi fabriquée par ASUS, Dell, HP, Lenovo et Acer. Comptez donc autour de 4 500-5 000 € pour la version actuelle — le prix d'un bon poste de travail, pas d'un serveur.
Ce que ça change vraiment (et ce que ça ne change pas)
Soyons honnêtes, parce que le marketing ne l'est pas : la DGX Spark n'est pas un serveur de production pour servir des milliers d'utilisateurs. Sa bande passante mémoire (273 Go/s) est modeste à côté d'un GPU de datacenter comme une H100 (plus de dix fois plus). Résultat : sur un très gros modèle, elle génère du texte lentement. Ce n'est pas la machine qui fera tourner votre chatbot public à pleine charge.
Ce qu'elle change, c'est autre chose, et c'est important pour une PME :
Prototyper l'IA en local, sur un bureau, sans louer du GPU cloud à l'heure. On teste, on itère, on casse, sans facture qui grimpe.
Garder les données chez soi. Pour les secteurs où rien ne doit sortir (santé, juridique, données sensibles), c'est un atout direct — le sujet de notre article sur l'hébergement local.
Fine-tuner des modèles jusqu'à 70 Md de paramètres sans datacenter. Pour les cas où le fine-tuning est vraiment justifié, c'est un raccourci sérieux.
Faut-il en acheter une ?
Si vous êtes une PME curieuse de l'IA, la DGX Spark n'est pas un achat réflexe. C'est un outil de développement et de confidentialité, pas une baguette magique. La bonne démarche : d'abord savoir quel problème vous voulez résoudre, ensuite décider si le local — et donc une machine comme celle-ci — est la bonne réponse.
C'est exactement ce qu'on fait en amont : on regarde votre cas, vos données, vos contraintes, et on vous dit franchement si une DGX Spark a du sens chez vous ou si une bonne API suffit. Parlons-en.