币搜网报道:
本周,两家美国人工智能实验室发布了开源模型,但各自采用截然不同的方法来解决同一个问题:如何与中国在公共人工智能系统领域的统治地位竞争。
Deep Cogito 发布了 Cogito v2.1,这是一个拥有 6710 亿个参数的庞大模型,其创始人 Drishan Arora 称之为“美国公司最好的开放权重 LLM”。
艾伦人工智能研究所反驳道:“别急。”Olmo 3 被誉为“最佳完全开源的基础模型”,并拥有完全的透明度,包括其训练数据和代码。
具有讽刺意味的是,Deep Cognito 的旗舰机型正是建立在……之上的。Arora 在 X 上承认,Cogito v2.1“从 2024 年 11 月起,基于开源许可的 Deepseek 基础模型分叉而来”。
这引发了一些批评,甚至引发了关于微调中国模型是否算作美国人工智能进步的争论,或者这是否仅仅证明了美国实验室落后了多少。
无论如何,Cogito 相对于 DeepSeek 的效率提升是真实存在的。
Deep Cognito 声称 Cogito v2.1 生成的推理链比 DeepSeek R1 短 60%,同时保持了具有竞争力的性能。
Arora 称之为“迭代提炼和放大”——通过自我改进循环来训练模型,使其发展出更好的直觉——这家初创公司仅用了 75 天就利用 RunPod 和 Nebius 的基础设施训练出了自己的模型。
如果基准测试结果属实,这将是目前由美国团队维护的最强大的开源LLM。
为什么这很重要
到目前为止,中国在开源人工智能领域一直处于领先地位,美国公司为了保持竞争力,越来越依赖中国的基础模型——无论是悄悄地还是公开地。
这种动态存在风险。如果中国实验室成为全球开放人工智能的默认平台,美国初创企业将失去技术独立性、议价能力以及制定行业标准的能力。
开放权重人工智能决定谁控制着下游所有产品所依赖的原始模型。
目前,中国开源模型(DeepSeek、Qwen、Kimi、MiniMax)因为它们价格低廉、速度快、效率高,而且不断更新。.
图片来源:Artificialanalysis.ai
许多美国初创公司已经在使用这些技术,即使它们.
这意味着美国企业正在利用外国的知识产权、培训体系和硬件优化技术来构建业务。从战略角度来看,这使美国重蹈覆辙,再次面临半导体制造领域的困境:越来越依赖他国的供应链。
Deep Cogito 的方法——从 DeepSeek 的一个分支开始——展现了其优点(快速迭代)和缺点(依赖性)。
艾伦研究所的做法——以完全透明的方式构建 Olmo 3——展现了另一种选择:如果美国想要在开放人工智能领域占据领先地位,就必须从数据、训练方案到检查点,重建整个技术栈。这需要耗费大量人力物力,而且速度缓慢,但却能确保美国对底层技术的自主权。
理论上,如果您已经喜欢 DeepSeek 并在线使用它,Cogito 大多数情况下都能提供更好的答案。如果您通过 API 使用 Cogito,您会更加满意,因为其效率更高,您只需花费更少的钱就能获得高质量的回复。
艾伦研究所采取了截然相反的做法。Olmo 3 系列全系列产品均配备一个从零开始构建的 5.9 万亿个 Token 的训练数据集,以及每个训练阶段的完整代码、配方和检查点。
该非营利组织发布了三种模型变体——基础模型、思考模型和指导模型——分别具有 70 亿和 320 亿个参数。
该研究所写道:“人工智能领域的真正开放不仅仅关乎获取途径,更关乎信任、问责和共同进步。”
Olmo 3-Think 32B 是第一个达到如此规模的完全开放推理模型,它使用大约六分之一的类似模型(如 Qwen 3)的标记进行训练,同时取得了具有竞争力的性能。
图片:Ai2
Deep Cognito 已获得该公司于8月份获得由Benchmark领投的种子轮融资。这家初创公司计划发布参数量高达6710亿的前沿模型,这些模型将使用“更强大的计算能力和更好的数据集”进行训练。
与此同时,英伟达为 Olmo 3 的开发提供了支持,副总裁 Kari Briski 也参与其中。对于“开发者而言,利用开放的、美国制造的模型来扩展人工智能至关重要”。
该研究所使用谷歌云的 H100 GPU 集群进行训练,计算需求比 Meta 的 Llama 3.1 8B 减少了 2.5 倍。
Cogito v2.1 提供免费在线测试。该模型可供下载。但要注意:它需要一张非常强大的显卡才能运行。
Olmo 可供测试这些模型可以下载。这些产品对消费者更加友好,具体取决于你选择哪一款。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复