
小米大模型团队负责人罗福莉于 4 月 24 日在哔哩哔哩平台接受深度访谈(影片号:BV1iVoVBgERD),访谈时长 3.5 小时,为其首次以技术负责人身份公开系统性阐述技术观点。罗福莉称,大模型竞争赛道已从 Chat 时代转入 Agent 时代,并指出“自进化”将是未来一年 AGI 关键事件。
Chat 时代到 Agent 时代:核心技术判断

(来源:哔哩哔哩)
根据罗福莉在 Bilibili 访谈中的陈述,她指出 2026 年大模型竞争的重心已从通用对话品质转向在复杂任务中的持续自主执行能力。她在访谈中表示,目前顶尖模型已能在特定任务中自主最佳化,并持续稳定执行 2 至 3 天,不需要人类介入调整。她在访谈中强调,“自进化”能力的突破代表 AI 系统开始具备自我修正能力,并点名 Anthropic 的技术路径以及 Claude Opus 4.6 等技术变量对整个 AI 生态的影响。
小米算力配比调整与 Pre-train 代差评估
根据罗福莉在访谈中的披露,小米在算力分配策略上已进行重大调整。她说明,业界惯用的算力配比为 Pre-train:Post-train:Inference = 3:5:1,而小米当前策略已调整为 3:1:1,大幅压缩后训训练比例,同时提升推理阶段的资源投入。
她在访谈中解释,这一转变源于 Agent RL Scaling 策略的成熟,使后训训练不再需要大量算力堆叠,而推理端资源的提升反映了 Agent 落地场景对即时响应能力的需求。
对于国内大模型的 Pre-train 代差问题,罗福莉在访谈中表示,这一差距已从过去的 3 年缩短至数月,当前的策略重心正向 Agent RL Scaling 移动。罗福莉的职业历程涵盖阿里达摩院、幻方量化及 DeepSeek(DeepSeek-V2 核心开发者),于 2025 年 11 月加入小米。
MiMo-V2 系列技术规格与开源排名
根据小米官方于 2026 年 3 月 19 日发布的 MiMo-V2 系列公告,此次一次发布三款模型:
MiMo-V2-Pro:兆总参数,启用参数 42B,混合注意力架构,支援百万上下文,任务完成率 81%
MiMo-V2-Omni:全模态 Agent 场景
MiMo-V2-TTS:语音合成场景
根据公告,已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二,推理速度达 DeepSeek-V3.2 的 3 倍。
常见问题
罗福莉如何定义“自进化”,为何认为其是 AGI 最关键事件?
根据罗福莉 2026 年 4 月 24 日在 Bilibili 的访谈陈述(BV1iVoVBgERD),她在访谈中指出,目前顶尖模型已能在特定任务中自主最佳化并稳定执行 2 至 3 天而无需人类介入,并将“自进化”定性为未来一年 AGI 发展的最关键的事件。
小米在算力配比上做了哪些具体调整,背后逻辑为何?
根据罗福莉在访谈中的披露,小米的算力配比已从业界惯用的 Pre-train:Post-train:Inference = 3:5:1 调整为 3:1:1,大幅压缩后训练比例;她解释这一调整源于 Agent RL Scaling 策略成熟后后训效率提升,以及 Agent 落地场景对推理端即时响应能力的需求。
MiMo-V2-Flash 的开源排名与速度表现如何?
根据小米 2026 年 3 月 19 日发布的官方公告,已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二,推理速度达 DeepSeek-V3.2 的 3 倍,旗舰版 MiMo-V2-Pro 的任务完成率为 81%。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复