日前有消息源透露,字节跳动豆包团队或即将发布全新的实时语音大模型,并将基于该模型为豆包 App 引入实时语音通话功能。据称,目前这一功能已开始小范围测试,提供了 " 灵魂歌手 "、" 夸夸大师 "、" 受气小包 "、" 戏精本精 " 等选项。
但截至目前,字节跳动及豆包方面均尚未对此传言进行回应。
需要注意的是,不久前曾有消息称,豆包方面或将推出全新情感语音大模型,并且测试效果超过了 GPT-4o。据相关消息源透露,该传言所提及的模型即为上述实时语音模型。
据称,豆包全新实时语音大模型通过面向语音生成和理解进行统一建模,有别于此前的 ASR+LLM+TTS 级联方式,在对话效果上有大幅提升,不仅实现了低延时实时交互,还支持用户随时打断对话。
相关消息源指出,在对话的情感自然度方面," 相比大多数模型还在语气上粗线条上进行变化之外,豆包全新实时语音大模型在语音表现和智力的拟人性上有了质的提升 "。同时豆包全新实时语音大模型还有望支持多种方言,以及具备模仿能力。
值得一提的是,不久前 AI 智能助手豆包 AI 编程功能迎来升级,号称能够为用户提供更便捷的导入流程体验、更高效的交互体验、更易懂的解答方式。其中在导入流程上,豆包 AI 编程已支持用户一键上传多个本地代码文件、实时引入 GitHub 开源仓库等,从而快速获取项目的完整上下文。据了解,目前用户已可在豆包电脑版和网页版中体验相关功能。