在过去的几年里,我们经常谈论我们如何生活在人工智能 (AI) 的黄金时代。不久前还像科幻小说的想法现在变成了现实——没有比 Alexa 更好的例子了。最初只是白板上的草图,现已发展成为一种全新的计算范式,从根本上改变了世界各地人们在家中与技术互动的方式。Alexa 的设备销量已超过 50 亿台,每小时互动数以千万计,已成为数百万家庭家庭的一部分。我们一直认为 Alexa 是一项不断发展的服务,自 2014 年推出以来,我们一直在不断改进它。长期以来,我们一直致力于让与 Alexa 的对话像与另一个人交谈一样自然,随着生成式人工智能的快速发展,我们想象的现在已经触手可及。今天,我们很高兴与大家分享未来的早期预览。这是对由生成式人工智能提供支持的更智能、更具对话性的 Alexa 的早期观察。它基于一种新的大型语言模型 (LLM),该模型是针对语音交互定制和专门优化的,以及我们知道客户喜欢的东西——获取实时信息、高效的智能家居控制以及最大化他们的家庭娱乐。我们相信这将推动 Alexa 的未来,使我们能够增强五项基本功能:1。对话在过去的几年里,我们研究了很多关于对话的知识,我们知道对话超越了语言。在任何对话中,我们都会处理大量附加信息,例如肢体语言、对与您交谈的人的了解以及眼神交流。为了通过 Alexa 实现这一点,我们将 Echo 中传感器的输入(摄像头、语音输入、检测存在的能力)与可以理解这些非语言线索的 AI 模型融合在一起。我们还专注于减少延迟,以便对话自然流畅,没有停顿,并且响应的长度适合语音,而不是等同于听一个又一个的大声朗读段落。当您询问热门新闻报道的最新信息时,您会得到简洁的回复,只有最相关的信息。如果您想了解更多,可以跟进.2.现实世界的实用程序引入 Alexa 智能家居的新时代亚马逊通过由生成式 AI 提供支持的新 Alexa 体验以及使用 Echo Hub 和地图视图控制设备的新方法推进家庭自动化为了真正有用,Alexa 必须能够在现实世界中采取行动,这是 LLM 尚未解决的挑战之一——如何大规模集成 API 并可靠地调用它们以采取正确的作。这个新的 Alexa LLM 将通过 API 连接到数十万个现实世界的设备和服务。它还增强了 Alexa 处理细微差别和歧义的能力(就像一个人一样)并智能地采取行动。例如,LLM 使您能够完全通过语音对复杂的例程进行编程——客户只需说:“Alexa,每个工作日晚上 9 点,宣布孩子们睡觉时间到了,调暗楼上的灯,打开门廊灯,然后打开卧室的风扇。然后,Alexa 会自动对这一系列作进行编程,使其在每晚 9 点发生3。个性化和背景家庭法学硕士必须针对您和您的家人进行个性化设置。就像与另一个人的对话会受到上下文的影响一样,例如您之前的对话或情境上下文,Alexa 也需要这样做。下一代 Alexa 将能够根据您共享的偏好、与您交互的服务以及有关您的环境的信息提供独特的体验。Alexa 还在整个对话中继承相关上下文,就像人类一直做的那样。人们使用代词、流行语,并建立我们谈论的地点、时间或场景的上下文。向 Alexa 询问有关博物馆的问题,您将能够询问一系列有关其开放时间、展品和位置的后续信息,而无需重申任何先前的上下文,例如名称或您计划去的日期。个性客户一次又一次地告诉我们,他们喜欢 Alexa 的个性。你不希望家里有一个死记硬背的机器人伴侣,我认为 Alexa 的个性是 Alexa 被广泛采用的最大原因之一。正如我们常说的那样,最无聊的晚宴是没有人发表意见的晚宴——有了这个新的法学硕士,Alexa 将有一个观点,使对话更具吸引力。Alexa 可以告诉您哪些电影应该获得奥斯卡奖,当您正确回答测验问题时与您一起庆祝,或者写一张热情的便条供您发送以祝贺朋友最近毕业。信任在可信度和绩效之间不应该进行权衡。世界各地的客户都欢迎 Alexa 进入他们的家中,为了在他们的日常生活中真正有用,我们必须继续创造他们都喜爱和信任的体验。虽然生成式人工智能的集成带来了无限的新可能性,但我们赢得客户信任的承诺不会改变。与我们所有的产品一样,我们将设计体验来保护客户的隐私和安全,并赋予他们控制权和透明度。据我们所知,这是 LLM、实时服务和一套设备的最大集成,而且不仅限于浏览器中的选项卡。我们才刚刚开始——借助生成式 AI,我们还能够增强 Alexa 体验的许多核心组件。您需要了解的有关亚马逊为儿童推出的全新对话功能 Explore with Alexa 的所有信息亚马逊全新的 Explore with Alexa 是一种面向儿童的对话体验,它结合了有趣的事实和琐事问题,以激发更深层次的好奇心和探索。这些组成部分之一是客户如何开始与 Alexa 互动。这将建立在当今现有的体验之上,使选择注册 Visual ID 的客户只需面对 Echo Show 上的屏幕即可与 Alexa 开始对话,无需唤醒词。其结果是我们有史以来最自然的对话体验。其次,我们利用大模型构建了一个全新的对话式语音识别(CSR)引擎。作为人类,我们经常在谈话中停下来收集我们的想法,或强调一个观点,而识别这些线索对于人工智能来说非常困难。这种新的企业社会责任引擎能够适应那些常见的自然停顿和犹豫,从而实现更流畅、更自然的对话。最后,生成式人工智能使我们能够增强我们的文本转语音技术,使用大型转换器模型使 Alexa 更具表现力并适应对话提示。这意味着 Alexa 会适应您的提示并调节其响应和语气,类似于人类对话。询问 Alexa 您的团队是否获胜,如果赢了,它会用快乐的声音回应;如果他们输了,反应会更有同理心。向 Alexa 征求意见,反应会更加热情,就像朋友分享观点一样。为了展示我们已经走了多远,这里提醒一下我们首次推出时 Alexa 的声音:以下是 Alexa 明年初的声音:结合起来,这些增强功能将利用已经是世界上最好的个人人工智能,并使其变得更好。在过去的几个月里,我一直在使用这些新功能,感觉就像我十年前第一次与 Alexa 交谈时一样具有变革性。这并不是说它会很完美——Alexa 会犯错误——但是,就像往常一样,随着时间的推移,体验会继续变得更好。




 与 CNBC 的吉姆·克莱默 (Jim Cramer) 的对话.jpg)





