Предисловие:
В 2023–2024 мы спрашивали: «Сколько параметров в модели?»
В 2025‑м вопрос стал иным: «Сколько книг она проглотит?» и «Во сколько обойдётся инференс 1 млн токенов?»Этот сдвиг означает переход LLM от «эстетики грубой силы» к «точной инженерии». Маржинальная выгода от масштаба падает, а эффективность архитектуры, длина контекста и стоимость инференса становятся новой ареной. Ниже — три ключевых тренда 2025 года.
2025/3/4Около 3 мин
