Préface :
En 2023-2024, nous avions l'habitude de demander : "Combien de milliards de paramètres ce modèle a-t-il ?"
En 2025, la question est devenue : "Combien de livres ce modèle peut-il digérer ?" et "Combien de centimes coûte-t-il pour inférer 1 million de jetons ?"Ce changement de questionnement marque la transition des Grands Modèles de Langage (LLM) du stade de l'"Esthétique de la force brute" à l'"Ingénierie de précision". L'utilité marginale de la taille des paramètres diminue, tandis que l'efficacité architecturale, la longueur du contexte et les coûts d'inférence sont devenus les nouveaux champs de bataille. Cet article analyse en profondeur les trois tendances fondamentales de la pile technologique des modèles d'IA en 2025 à partir des premiers principes.
2025/3/4Environ 6 min
