الضبط الدقيق هو تدريب نموذج لغوي موجود على بيانات خاصة بمجالك لتخصيصه لحالات استخدامك.
Le fine-tuning (ou ajustement fin) est une technique d'apprentissage automatique qui part d'un LLM pré-entraîné (GPT, Llama, Mistral) et l'entraîne sur un jeu de données spécifique à votre entreprise. Le modèle résultant combine la compétence générale du modèle de base avec une expertise spécialisée sur votre domaine.
Contrairement au RAG qui récupère de l'information externe au moment de la réponse, le fine-tuning incorpore la connaissance directement dans les poids du modèle. Cela le rend plus rapide, plus consistent dans le style, et capable de maîtriser des termes très spécifiques sans références externes.
Le fine-tuning est particulièrement pertinent pour : adapter le ton et le style d'écriture de la marque, maîtriser un vocabulaire technique très spécifique (médical, juridique, industriel), améliorer les performances sur des tâches très spécialisées (classification, extraction d'entités).
Un modèle fine-tuné sur des milliers de comptes-rendus médicaux d'un CHU génère des comptes-rendus dans le style exact de l'établissement, avec le bon vocabulaire clinique et le bon formatage.
Un modèle fine-tuné sur 10 ans de contrats d'un cabinet rédige des clauses dans le style exact du cabinet et avec sa doctrine contractuelle habituelle.
Un modèle fine-tuné sur les fiches produit d'une marque génère des descriptions cohérentes avec l'identité de la marque, sans prompts élaborés à chaque fois.
Un modèle fine-tuné sur 5 ans de courriers de gestion de sinistres rédige automatiquement les réponses aux assurés dans le style, le vocabulaire réglementaire et le ton exact utilisés par l'entreprise.
Un modèle fine-tuné sur les rapports d'inspection qualité d'un site industriel génère des comptes-rendus conformes aux normes ISO 9001 avec le jargon technique spécifique au secteur.
| Critère | Fine-tuning | RAG |
|---|---|---|
| Coût initial | Élevé (entraînement) | Faible à moyen |
| Mise à jour des données | Réentraînement nécessaire | Facile (ajout de documents) |
| Sources citées | Non | Oui |
| Style/ton | Excellent | Correct |
| Vocabulaire spécifique | Excellent | Bon |
| Données récentes | Nécessite réentraînement | Temps réel |
يعتمد على المهمة. لتعديل الأسلوب، تكفي بضع مئات من الأمثلة. للتخصص العميق في الأعمال، تُوصى بآلاف إلى عشرات الآلاف من الأمثلة.
نعم، يتطلب التدريب وحدات GPU قوية. نستخدم عادة سحابات كـ AWS أو Google Cloud أو Azure، أو خدمات متخصصة كـ OpenAI Fine-tuning API أو Together AI.
من 5,000 إلى 50,000 يورو+ حسب حجم النموذج وحجم البيانات وعدد التكرارات اللازمة. تكاليف الاستنتاج (الاستخدام) بعد ذلك أقل بكثير من النموذج الأساسي العام.
في Propulse نفضل الضبط الدقيق على نماذج مفتوحة المصدر (Llama، Mistral) مُنشأة في بنيتك التحتية، مما يضمن عدم مغادرة بياناتك بيئتك أبداً.
الضبط الدقيق مُوصى به حين تحتاج لتكييف أسلوب الكتابة أو النبرة أو مفردات متخصصة جداً. RAG أفضل للوصول إلى قاعدة وثائق متطورة. عملياً، الجمع بينهما (ضبط دقيق + RAG) يُعطي أفضل النتائج لحالات الاستخدام المتطلبة.
احسب 4 إلى 12 أسبوعاً حسب التعقيد: أسبوعان لتحضير البيانات، 1 إلى 4 أسابيع للتدريب والتكرارات، ثم 2 إلى 6 أسابيع للاختبار والإنتاج. مرحلة تحضير البيانات غالباً الأطول لأن جودة البيانات تحدد النتائج.
ننطلق من وضعك الفعلي: أدواتك، عملياتك، بياناتك. بدون مصطلحات معقدة — فقط نتائج.