xAI 於 7 月 1 日宣布推出 Voice Agent Builder Beta 版,這是完全無程式碼的 AI 語音代理建置平台,讓用戶可在 2 分鐘內透過自然語言提示建置完成企業級語音代理;平台採用與 Grok Voice 緊密耦合的端到端 Speech-to-Speech 單一語音路徑,基準測試超越 GPT。
τ-voice Bench 基準測試:Grok Voice Think Fast 1.0 超越 GPT

(來源:xAI 網站)
根據 xAI 官方公布,Grok Voice Think Fast 1.0 在 τ-voice Bench 語音基準測試排行榜位居首位,在反應速度與推理能力兩項指標上直接超越 Google Gemini 3.1 Flash Live 及 OpenAI GPT Realtime 1.5。
xAI 說明,Grok Voice 使用真實且被設計為「最困難」的通話情境訓練,涵蓋低品質電話雜音、強烈口音、用戶中途打斷及模糊指令等場景,並原生支援 25 種以上語言。
端到端 Speech-to-Speech 架構:單一語音路徑取代傳統 STT+LLM+TTS 拼裝架構
xAI 官方說明,傳統企業 AI 語音客服須將語音轉文字(STT)、大型語言模型(LLM)與文字轉語音(TTS)三個獨立系統串接,這種拼裝架構增加了多跳點延遲,並提高錯誤率與運營成本。
Voice Agent Builder 採用與 Grok Voice 緊密耦合的端到端 Speech-to-Speech 單一語音路徑,整個語音處理流程不分段切換,旨在降低延遲並減少串接錯誤。
知識庫、工具串接、語音克隆與電話接入:四大核心功能規格
根據 xAI 官方功能說明,Voice Agent Builder 四大核心功能模組規格如下:
知識庫(Knowledge Base):支援上傳 Word、Excel、PDF、JSON 等格式,可整理為跨代理共享的 Collections,確保產品規格與政策一致性
工具串接(Tools & Connectors):內建 Google/Outlook 日曆、Web 搜尋、X(Twitter)搜尋及 Notion;支援轉接真人客服、結束通話與即時團隊通知
語音與電話(Voice & Telephony):提供 80 款以上內建語音;支援僅需 2 分鐘音訊的品牌語音克隆;可免費獲取 xAI 提供的電話號碼,或透過 SIP 串接現有總機系統
透明計價(Pricing):算力 API 費用每分鐘 0.05 美元,不收額外平台費;使用 xAI 提供的電話號碼時,額外收取每分鐘 0.01 美元通訊費
企業安全機制:自動錄音逐字稿、工具使用記錄與對話邊界設定
根據 xAI 官方公告,Voice Agent Builder 針對企業級用戶內建監控機制(Observability)與安全護欄(Guardrails):每通電話自動錄音並生成逐字稿;管理員可隨時查看 AI 在通話中使用的工具記錄;並可設定嚴格的對話邊界,例如強制禁止 AI 讀出客戶信用卡卡號,或禁止與用戶討論離題的政治話題。
xAI 在官方公告中表示:「用耳朵判斷比看基準測試更準確——建一個代理,用你最困難的工作流程打電話試試看。」
常見問題
xAI Voice Agent Builder 的算力費用是多少?
根據 xAI 官方公告,算力 API 費用為每分鐘 0.05 美元,不收額外平台費;若使用 xAI 免費提供的電話號碼,則額外收取每分鐘 0.01 美元通訊費。
Grok Voice Think Fast 1.0 在 τ-voice Bench 的表現如何?
根據 xAI 官方公布,Grok Voice Think Fast 1.0 在 τ-voice Bench 基準測試中超越 Google Gemini 3.1 Flash Live 及 OpenAI GPT Realtime 1.5,在反應速度與推理能力兩項指標上位居排行榜首位。
xAI Voice Agent Builder 目前可在哪裡試用?
根據 xAI 官方公告,Voice Agent Builder Beta 版已於 xAI Console 正式上線,開放試用。
免责声明:以上内容(如有图片或视频亦包括在内)均为平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。
本站尊重他人的知识产权、名誉权等法律法规所规定的合法权益!如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到qklwk88@163.com,本站相关工作人员将会进行核查处理回复