亚马逊推出全新语音AI模型Nova Sonic，开启人机“唠家常”新境界

TRI

点击下方链接关注我们

亚马逊（Amazon）近日正式推出其全新语音AI模型Nova Sonic，将语音辨识、理解及生成整合在单一模型，使AI能够听得懂，并且产生更像真人谈话的语音对话，这一创新技术旨在提升人机对话的自然度和互动性。

Nova Sonic结合了语音理解与生成的能力，让AI语音助手的表现更接近真人对话，并能够实时识别说语者的语气与情感。即使面对说话含糊不清或吵杂环境，它也能准确理解说话者意图。Nova Sonic能够判别人类对话的细微差异，包括说话者的自然停顿和犹豫、会等待适当时机发言，还能优雅地插入对方谈话。此外，Nova Sonic还能生成文字转录，供开发者在不同应用情境使用。根据亚马逊的说法，这一模型是目前市场上最具成本效益的选择，并且在性能上与OpenAI和 Google的先进语音模型相媲美。

图片来源于网络新闻

Nova Sonic的设计理念在于舍弃传统的多模型架构，改为单一系统同步处理语音输入、语意理解与语音输出，这不仅简化了开发流程，还保留了人类对话中的关键要素，如语气、语调、节奏和停顿。亚马逊展示了多个实际应用案例，包括旅游和企业AI助理，Nova Sonic能够根据说话者的语气调整语调，并在多轮对话中提供自然的互动体验。

这一模型目前已通过亚马逊Bedrock平台向客户提供服务，并通过一个新的API 对外开放，帮助客户简化语音应用程序的开发，例如应用于客户服务、自动化通话及开发涵盖旅游、教育、医疗保健、娱乐等各行各业的AI代理（AI agents）。亚马逊的高级副总裁 Rohit Prasad 表示，Nova Sonic 的部分组件已经被整合到新一代的Alexa Plus语音助手中。亚马逊强调，Nova Sonic则是其整合实力与创新研发的最新成果，未来将持续推进语音AI在真实应用中的发展。

在AI语音技术竞争日益激烈的当下，亚马逊的Nova Sonic不仅是对市场需求的回应，更是其在未来AI应用中关键的一步。随着技术的进步，未来的语音助手将变得更加智能，能够更好地理解和回应用户的需求。

文章内容整理自科技新报

精选阅读

▶▶▶

Hello

医疗感测驱动智慧医疗变革，AI+数据引领未来健康管理

Manus问世，持续拓展AI Agent的应用探索

从DeepSeek崛起看Agentic AI应用趋势

关注我们

微信号｜拓墣产业研究院

拓墣网站｜topology.com.cn

发现“分享”和“赞”了吗，戳我看看吧

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

声界

智能语音技术速报

亚马逊推出全新语音AI模型Nova Sonic，开启人机“唠家常”新境界