Grok上线声音克隆:录一分钟,就能做自己的AI声线

据动察 Beating 监测,xAI 推出 Grok Custom Voices 和 Voice Library。用户可以在 xAI 控制台录一段声音,生成自己的 voice_id,再接入 Grok TTS 或 Voice Agent API,用于客服 agent、内容创作、游戏角色、有声书旁白等场景。这套功能不是简单上传音频就能克隆。用户需要朗读验证短句,系统会用 STT 做实时转写,并比对验证录音和完整录音的说话人特征,确认是同一个人后才生成声线。xAI 称,这样可以防止用现成录音克隆他人声音。目前 Custom Voices 只在美国开放,伊利诺伊州除外。控制台最多可免费创建 30 个自定义声音,API 创建能力只开放给 Enterprise 团队。自定义声音本身不额外收费,但调用语音 API 仍按量计费:Realtime 为 $3.00/小时,Text to Speech 为 $4.20/百万字符。

上一篇:

下一篇:

风险提示:理性看待区块链,提高风险意识!