亚马逊推出全新语音AI模型Nova Sonic,开启人机“唠家常”新境界

TRI

点击下方链接 关注我们

亚马逊(Amazon)近日正式推出其全新语音AI模型Nova Sonic,将语音辨识、理解及生成整合在单一模型,使AI能够听得懂,并且产生更像真人谈话的语音对话,这一创新技术旨在提升人机对话的自然度和互动性。

Nova Sonic结合了语音理解与生成的能力,让AI语音助手的表现更接近真人对话,并能够实时识别说语者的语气与情感。即使面对说话含糊不清或吵杂环境,它也能准确理解说话者意图。Nova Sonic能够判别人类对话的细微差异,包括说话者的自然停顿和犹豫、会等待适当时机发言,还能优雅地插入对方谈话。此外,Nova Sonic还能生成文字转录,供开发者在不同应用情境使用。根据亚马逊的说法,这一模型是目前市场上最具成本效益的选择,并且在性能上与OpenAI和 Google的先进语音模型相媲美。

图片来源于网络新闻

Nova Sonic的设计理念在于舍弃传统的多模型架构,改为单一系统同步处理语音输入、语意理解与语音输出,这不仅简化了开发流程,还保留了人类对话中的关键要素,如语气、语调、节奏和停顿。亚马逊展示了多个实际应用案例,包括旅游和企业AI助理,Nova Sonic能够根据说话者的语气调整语调,并在多轮对话中提供自然的互动体验。

这一模型目前已通过亚马逊Bedrock平台向客户提供服务,并通过一个新的API 对外开放,帮助客户简化语音应用程序的开发,例如应用于客户服务、自动化通话及开发涵盖旅游、教育、医疗保健、娱乐等各行各业的AI代理(AI agents)。亚马逊的高级副总裁 Rohit Prasad 表示,Nova Sonic 的部分组件已经被整合到新一代的Alexa Plus语音助手中。亚马逊强调,Nova Sonic则是其整合实力与创新研发的最新成果,未来将持续推进语音AI在真实应用中的发展。

在AI语音技术竞争日益激烈的当下,亚马逊的Nova Sonic不仅是对市场需求的回应,更是其在未来AI应用中关键的一步。随着技术的进步,未来的语音助手将变得更加智能,能够更好地理解和回应用户的需求。

文章内容整理自科技新报

精选阅读

▶▶▶

Hello

医疗感测驱动智慧医疗变革,AI+数据引领未来健康管理

Manus问世,持续拓展AI Agent的应用探索

从DeepSeek崛起看Agentic AI应用趋势

关注我们

微信号拓墣产业研究院

拓墣网站|topology.com.cn

发现“分享”“赞”了吗,戳我看看吧