Livre blanc sur l'évolution des modèles 2025 : Ère post-Transformer du contexte long, de la parcimonie et de l'architecture

Préface :
En 2023-2024, nous avions l'habitude de demander : "Combien de milliards de paramètres ce modèle a-t-il ?"
En 2025, la question est devenue : "Combien de livres ce modèle peut-il digérer ?" et "Combien de centimes coûte-t-il pour inférer 1 million de jetons ?"

Ce changement de questionnement marque la transition des Grands Modèles de Langage (LLM) du stade de l'"Esthétique de la force brute" à l'"Ingénierie de précision". L'utilité marginale de la taille des paramètres diminue, tandis que l'efficacité architecturale, la longueur du contexte et les coûts d'inférence sont devenus les nouveaux champs de bataille. Cet article analyse en profondeur les trois tendances fondamentales de la pile technologique des modèles d'IA en 2025 à partir des premiers principes.

Institut Augmunt pour la technologie de pointe2025/3/4Environ 6 min