小米大模型负责人：AI 竞争转向 Agent 时代，自进化是 AGI 关键事件

小米大模型团队负责人罗福莉于 4 月 24 日在哔哩哔哩平台接受深度访谈（影片号：BV1iVoVBgERD），访谈时长 3.5 小时，为其首次以技术负责人身份公开系统性阐述技术观点。罗福莉称，大模型竞争赛道已从 Chat 时代转入 Agent 时代，并指出“自进化”将是未来一年 AGI 关键事件。

Chat 时代到 Agent 时代：核心技术判断

（来源：哔哩哔哩）

根据罗福莉在 Bilibili 访谈中的陈述，她指出 2026 年大模型竞争的重心已从通用对话品质转向在复杂任务中的持续自主执行能力。她在访谈中表示，目前顶尖模型已能在特定任务中自主最佳化，并持续稳定执行 2 至 3 天，不需要人类介入调整。她在访谈中强调，“自进化”能力的突破代表 AI 系统开始具备自我修正能力，并点名 Anthropic 的技术路径以及 Claude Opus 4.6 等技术变量对整个 AI 生态的影响。

小米算力配比调整与 Pre-train 代差评估

根据罗福莉在访谈中的披露，小米在算力分配策略上已进行重大调整。她说明，业界惯用的算力配比为 Pre-train:Post-train:Inference = 3:5:1，而小米当前策略已调整为 3:1:1，大幅压缩后训训练比例，同时提升推理阶段的资源投入。

她在访谈中解释，这一转变源于 Agent RL Scaling 策略的成熟，使后训训练不再需要大量算力堆叠，而推理端资源的提升反映了 Agent 落地场景对即时响应能力的需求。

对于国内大模型的 Pre-train 代差问题，罗福莉在访谈中表示，这一差距已从过去的 3 年缩短至数月，当前的策略重心正向 Agent RL Scaling 移动。罗福莉的职业历程涵盖阿里达摩院、幻方量化及 DeepSeek（DeepSeek-V2 核心开发者），于 2025 年 11 月加入小米。

MiMo-V2 系列技术规格与开源排名

根据小米官方于 2026 年 3 月 19 日发布的 MiMo-V2 系列公告，此次一次发布三款模型：

MiMo-V2-Pro：兆总参数，启用参数 42B，混合注意力架构，支援百万上下文，任务完成率 81%

MiMo-V2-Omni：全模态 Agent 场景

MiMo-V2-TTS：语音合成场景

根据公告，已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二，推理速度达 DeepSeek-V3.2 的 3 倍。

常见问题

罗福莉如何定义“自进化”，为何认为其是 AGI 最关键事件？

根据罗福莉 2026 年 4 月 24 日在 Bilibili 的访谈陈述（BV1iVoVBgERD），她在访谈中指出，目前顶尖模型已能在特定任务中自主最佳化并稳定执行 2 至 3 天而无需人类介入，并将“自进化”定性为未来一年 AGI 发展的最关键的事件。

小米在算力配比上做了哪些具体调整，背后逻辑为何？

根据罗福莉在访谈中的披露，小米的算力配比已从业界惯用的 Pre-train:Post-train:Inference = 3:5:1 调整为 3:1:1，大幅压缩后训练比例；她解释这一调整源于 Agent RL Scaling 策略成熟后后训效率提升，以及 Agent 落地场景对推理端即时响应能力的需求。