2025年モデル進化白書：ロングコンテキスト、疎性、新アーキテクチャのポストTransformer時代

序文:
2023年から2024年にかけて、私たちはこう尋ねることに慣れていました。「このモデルは何十億パラメータですか？」
2025年までに、質問はこう変わりました。「このモデルは何冊の本を消化できますか？」そして「100万トークンを推論するのに何セントかかりますか？」

この質問の変化は、大規模言語モデル（LLM）が**「力技の美学」から「精密工学」**の段階へと移行したことを示しています。パラメータサイズの限界効用は逓減しており、アーキテクチャ効率、コンテキスト長、推論コストが新たな戦場となっています。この記事では、第一原理から2025年のAIモデル技術スタックの3つの核心トレンドを深く分析します。

Augmunt Institute for Frontier Technology2025/3/4約4分