Le fine-tuning ? Vous n'en avez sûrement pas besoin
« Fine-tuner un modèle » est la demande qu'on reçoit le plus, et celle qu'on refuse le plus souvent. Voici pourquoi — et les trois marches à monter avant.
Par Nacim Moudjeb6 min4
La demande qu'on reçoit le plus — et qu'on refuse le plus souvent
« On voudrait fine-tuner un modèle sur nos données. » On entend cette phrase chaque semaine. Et la plupart du temps, on répond non. Pas par manque de compétence — on sait le faire. Parce que neuf fois sur dix, c'est une réponse à 30 000 € à un problème qui se règle pour quelques centaines.
Le mot « fine-tuning » est devenu un réflexe. Il sonne sérieux, sur-mesure, premium. Le souci, c'est qu'on lui prête un pouvoir qu'il n'a pas. Avant de signer un projet pareil, il faut comprendre ce qu'il fait — et surtout ce qu'il ne fait pas.
Ce que le fine-tuning fait vraiment
Fine-tuner, c'est reprendre un modèle déjà entraîné et lui montrer des milliers d'exemples pour ajuster son comportement. À la sortie, le modèle répond différemment : il adopte un ton, un format, une manière. C'est efficace pour une chose : la forme.
Ce que le fine-tuning ne fait pas, c'est apprendre vos données. C'est le malentendu numéro un. Fine-tuner un modèle sur vos 4 000 fiches produits ne lui apprend pas vos produits — ça lui apprend à de vos fiches. Demandez-lui le prix d'une référence précise : il inventera une réponse plausible. Avec aplomb. C'est exactement ce que vous ne voulez pas.
imiter le style
Pour qu'un modèle connaisse vos données, il existe une autre méthode. Plus simple, moins chère, plus fiable.
Les trois marches à monter avant de fine-tuner
La règle, partagée par à peu près tous ceux qui font ça sérieusement (IBM et InterSystems la résument pareil) : on essaie le prompting, puis le RAG, et on ne fine-tune qu'en dernier recours. Trois marches. Dans la grande majorité des cas, on ne monte jamais plus haut.
1. Le prompting. Donner au modèle des instructions claires, des exemples, le contexte de la tâche. Ça paraît basique. C'est sous-estimé à un point fou. Un prompt bien construit transforme un modèle générique en assistant qui répond comme votre meilleur collaborateur — sans une ligne d'entraînement. Beaucoup de projets « il faut fine-tuner » se règlent ici, en deux jours.
2. Le RAG : brancher vos données. Le RAG connecte le modèle à vos documents, votre CRM, vos tarifs, en direct. Quand on lui pose une question, il va chercher la bonne info chez vous, puis répond avec. Il cite vos vrais chiffres au lieu de les inventer. C'est ça, « une IA qui connaît votre entreprise » — pas le fine-tuning. Et le jour où un prix change, vous mettez à jour un document, pas un modèle entier. Voir notre approche RAG & base de connaissances.
3. L'agent : lui donner des mains. Un modèle seul ne fait que parler. L'agent, c'est tout ce qu'on construit autour pour qu'il agisse : lire vos outils, lancer des actions, vérifier son travail, recommencer. La différence entre une IA qui explique comment faire un devis et une IA qui fait le devis. La quasi-totalité de la valeur qu'on installe chez nos clients vient de là, pas d'un modèle réentraîné. C'est tout le principe de nos agents IA.
Alors, le fine-tuning, c'est pour qui ?
Pour des cas réels, mais étroits. Quand il vous faut un ton ou un format très précis, répété des millions de fois, que le prompting ne tient pas assez régulièrement. Quand le volume est tel que raccourcir chaque requête fait économiser gros. Quand une tâche de niche — classer des documents d'un métier très spécifique, par exemple — gagne vraiment à être gravée dans le modèle.
Ces cas existent. On en fait, c'est même un de nos services. Mais ils arrivent après qu'on a prouvé la valeur avec les trois marches du dessus — pas à leur place. Le fine-tuning, c'est de l'optimisation, pas un point de départ.
Le vrai coût de fine-tuner trop tôt
Fine-tuner, ce n'est pas « entraîner une fois ». C'est constituer un jeu de données propre — le gros du travail, et le plus ingrat —, entraîner, évaluer, héberger le modèle, et recommencer à chaque fois que vos données ou vos besoins bougent. Vous ne maintenez plus un prompt : vous maintenez un modèle.
Pendant ce temps, le concurrent qui a branché un bon RAG sur un modèle récent a déjà livré — et il profite gratuitement de chaque nouvelle version du modèle de base. Vous, vous êtes figé sur la version que vous avez entraînée. C'est le piège : payer plus cher pour avancer moins vite.
Par où commencer
On prend votre cas, et on monte les marches dans l'ordre. Prompting d'abord. Vos données en RAG si besoin. Un agent si la tâche demande d'agir, pas seulement de répondre. Et fine-tuning seulement si, à l'arrivée, c'est la seule marche qui manque. C'est moins vendeur que « on va entraîner votre IA ». C'est surtout ce qui marche, et ce qui vous coûte le moins.
Si quelqu'un vous propose de fine-tuner avant d'avoir essayé le reste, méfiez-vous : soit il vend ce qu'il sait faire, soit il facture au poids.