L'inférence, c'est le moment où un modèle d'IA déjà entraîné utilise ce qu'il a appris pour faire des prédictions ou générer du contenu à partir de nouvelles données. Si l'entraînement c'est la phase d'apprentissage (semaines, millions de dollars), l'inférence c'est la phase d'utilisation au quotidien — celle que tu vois quand tu poses une question à ChatGPT. C'est pendant l'inférence que le modèle applique ses milliards de paramètres pour transformer ton input en output. L'optimisation de l'inférence est un enjeu majeur pour la vitesse, le coût et l'accessibilité de l'IA.
💬 En termes simples
C'est le moment où l'étudiant passe l'examen (l'utilisation), par opposition au moment où il étudie (l'entraînement).
🎯 Exemple concret
La fraction de seconde où ChatGPT réfléchit avant d'afficher sa réponse à votre écran.
💡 Le saviez-vous ?
L'inférence coûte moins cher en énergie que l'entraînement, mais elle se produit des milliards de fois par jour.
Reçois chaque semaine le meilleur de l'actualité IA, directement dans ta boîte.
Pas de pourriel, désinscription en 1 clic.
✉️
Restez informé
Recevez nos sélections d'outils et articles directement dans votre boîte courriel.
🔐 Connexion rapide
Entrez votre courriel pour recevoir un code à 6 chiffres.
Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !
✓
Paramètres de confidentialité
Nous utilisons des témoins (cookies) pour assurer le bon fonctionnement du site, analyser le trafic et personnaliser le contenu. Vous pouvez gérer vos préférences ci-dessous.
Politique de confidentialité