xAI 推出 Voice Agent Builder 无代码平台,基于原生 speech-to-speech 架构 Grok Voice,打通语音识别、大模型、语音合成全链路。用户用自然语言描述流程、上传文档作为知识库,两分钟即可生成带工具调用、安全护栏、全链路监控的完整语音智能体,并免费附赠一个电话号码。支持日历、搜索、工单等内置功能,可接入自有号码和系统。定价 $0.05/分钟,无额外平台费。
damn!语音AI圈的天,一夜之间就变了,感觉以前所有的缝合怪方案,突然全成了过渡品🤔
之前市面上的语音智能体,全是靠三四家不同厂商的API硬拼出来的,语音转文字加大模型再加文字转语音,每一层跳转都多一分延迟多一块成本多一个故障点,对话经常卡顿断片跑题,听起来永远像机器人念稿。
@xai 直接做了原生的speech-to-speech一体化架构,Grok Voice从底层打通全部环节,一个接口覆盖所有能力。 延迟更低成本更低故障点更少,对话自然度直接上了一个台阶,这才是真正能规模化落地的生产级系统,和演示玩具完全不在一个维度。
更狠的是落地门槛被直接打穿, 用自然语言描述一遍业务流程,扔几份文档当知识库,选个声音,两分钟就能生成带工具调用带安全护栏带全链路监控的完整语音智能体,免费还送一个电话号码。
知识库检索日历API搜索工单文件全自带,想接自己的号码和系统也完全支持。
定价直接压到每分钟五美分,没有额外平台费,每天用一小时也就几块钱,小团队甚至个人都能大规模用起来。
这已经不是常规的功能迭代了兄弟们,简直就是彻头彻尾的降维打击。
以前搭一套靠谱的语音客服要好几周好几万,现在两分钟加极低的成本就能跑通。
而且做多智能体系统的人更是直接拿到了新的器官,自己的认知和工具体系,瞬间就长出了耳朵和嘴巴,和真实世界的交互直接打开了新维度。