前言:
在很长一段时间里,多模态 AI(Multimodal AI)被视为一种“有趣的玩具”。它能生成漂亮的二次元插画,也能合成一段滑稽的特朗普跳舞视频,但当你试图用它制作一部哪怕 3 分钟的连续动画,或者设计一个可以直接导入 Unity 的 3D 资产时,它就会暴露出各种致命缺陷:人物闪烁、物理崩坏、风格漂移。2025 年 3 月,随着 Sora v2(假设版本)、Runway Gen-4 和 Midjourney 3D 的集中爆发,临界点被突破了。多模态 AI 正在完成从“生成像素”到“模拟物理”的进化。本文将深度剖析这场变革背后的技术驱动力与产业回响。
2025/3/2大约 7 分钟
