绿色小软件下载
当前位置:首页 >> 站长休闲 >> 亚马逊的新 Nova Sonic 基础模型不仅能理解你说什么,还能理解你如何说

亚马逊的新 Nova Sonic 基础模型不仅能理解你说什么,还能理解你如何说

马克·扎克伯格 站长休闲 6

十多年来,亚马逊一直走在开发基于语音的技术的最前沿,这些技术为对话式 AI 应用程序提供支持,从构建 Alexa 等世界上最好的个人 AI 助手,到开发 Lex、Polly 和 Connect 等 AWS 服务。但是,要使语音 AI 为客户带来更多现实世界的价值,它必须考虑到人类对话的细微差别和复杂性。当谈到对话时,单词是有意义的,但如果没有赋予它们深度的声学背景,仅靠单词可能会平淡无奇。如何说某事与说什么同样重要,甚至更重要。到目前为止,利用人工智能做到这一点一直是一个挑战。Amazon 让开发人员和技术爱好者更容易探索 Amazon Nova,其先进的 Gen AI 模型在 nova.amazon.com 上与我们的基础模型配合使用,并访问 Amazon Nova Act SDK 来构建在 Web 浏览器中执行作的代理。今天,亚马逊宣布推出 Amazon Nova Sonic,这是一种新的基础模型,可将语音理解和语音生成统一到一个模型中,以便在 AI 应用程序中实现更像人类的语音对话。该模型可通过 Amazon Bedrock 中的新 API 使用,简化了语音应用程序的开发,例如客户服务呼叫自动化和 AI 代理,适用于旅游、教育、医疗保健、娱乐等广泛行业。获得语气、风格和节奏的语音系统构建支持语音的应用程序的传统方法涉及多个模型的复杂编排,例如将语音转换为文本的语音识别、用于理解和生成响应的大型语言模型 (LLM) 以及将文本转换回音频的文本转语音。这种碎片化的方法不仅增加了开发的复杂性,而且无法保留关键的声学背景和细微差别,如语气、韵律和说话风格,而这些对于自然对话至关重要。Nova Sonic 采用新方法来解决这些挑战。它不使用不同的模型,而是将理解和生成能力统一到一个模型中。这种统一使模型能够使生成的语音响应适应声学环境(例如语气、风格)和口语输入,从而产生更自然的对话。Nova Sonic 甚至了解人类对话的细微差别,包括说话者自然的停顿和犹豫,等待到适当的时间才说话,以及优雅地处理闯入。基于 Amazon Nova Sonic 构建的旅行 AI 代理示例:在这次对话中,一位客户与虚拟旅行助手就夏威夷之旅进行了互动。当客户的语气从兴奋转变为担心成本时,人工智能的语气会变得更加令人放心,因为它会提取相关的定价信息。它还为用户的语音生成文本记录,使开发人员能够使用该文本调用特定的工具和 API 来构建支持语音的 AI 代理,例如这个 AI 驱动的旅行社示例,它可以通过检索最新的航班信息来预订航班。这些功能及其闪电般的推理速度使由 Nova Sonic 提供支持的语音应用程序更加自然和有用。基于 Amazon Nova Sonic 构建的企业 AI 助手示例:在此示例中,仪表板 AI 助手展示了企业客户如何从 Nova Sonic 在公司数据中做出响应的能力中受益。助手以自然的对话语气提取报告并共享准确的数据,同时主动提出相关的后续问题。流畅的对话可以实现多轮交换,而无需说话者明确设置上下文。可帮助您使用生成式 AI 的免费和低成本 AWS 课程指南超过 135 个 AWS 培训,适用于各种经验水平的所有人。随着 Nova Sonic 的推出,亚马逊继续创新,采用最先进的基础模型,为每位亚马逊买家提供实际价值。

亚马逊的新 Nova Sonic 基础模型不仅能理解你说什么,还能理解你如何说

协助本站SEO优化一下,谢谢!
关键词不能为空

免责声明

本站有部分为网络搜集整理而来, 如有版权及内容质疑,请即刻联系站长整改。分享是美德,欢迎转载,敬请注明出处

同类推荐
控制面板
您好,欢迎到访网站!
  查看权限
标签列表