Amazon Web Services (AWS) 宣布在 Amazon Bedrock 中推出 Palmyra X5,这是一种新的、最先进的自适应推理模型,具有 100 万个令牌上下文窗口。Palmyra X5 由企业生成式 AI 领域的领导者 Writer 发布,是 Amazon Bedrock 中首批提供这种规模的上下文窗口的软件之一。它针对速度和成本效率进行了优化,使客户能够构建先进的多步骤 AI 代理,并改变他们精确推理大量企业数据的方式。AWS 是第一家也是目前唯一一家从 Writer 提供完全托管的无服务器模型的云提供商,包括新的 Palmyra X5 和 Palmyra X4,其他模型即将推出。亚马逊新的 Nova Sonic 基础模型不仅能理解你说什么,还能理解你如何说我们的新一代 AI 模型可以理解语气、语调变化和节奏,从而更深入地了解人类对话。随着生成式 AI 的不断加速发展,客户需要多种模型选择,以选择最适合其需求的模型。将 Writer 添加到 Amazon Bedrock 扩展了领先 AI 公司提供的已经最广泛的完全托管模型选择,让客户可以轻松安全地构建和扩展生成式 AI 应用程序,从而实现转型并帮助他们在整个业务中进行创新。为什么您应该关心Palmyra X5 是 Amazon Bedrock 中首批提供的 1M 上下文窗口模型之一,进一步扩展了 AWS 客户可用的选项。(上下文窗口是模型可以处理和“记住”每个输入或请求的信息量。它以标记(模型可以处理的最小文本单位)来衡量,可以被认为是模型的“短期记忆”)。有了这种大小的上下文窗口,Palmyra 可以准确处理 1500 页的内容,相当于 ~6 本书。它也是业界首批商用的自适应推理模型之一。该模型将高级大型语言模型 (LLM) 的功能与扩展的内存和处理能力相结合。企业现在可以在不超出预算的情况下处理长期任务 — 财务报告、法律合同分析、医疗记录综合、客户反馈挖掘等。 除了推理功能之外,Palmyra X5 还提供了支持可以与系统交互的代理、高级代码生成和部署以及跨 30 多种语言的多语言支持的能力。认识 AI:什么是 Palmyra X5如果 Palmyra X5 是一个人,他们将拥有在 22 秒内阅读 100 万个单词的超人能力,并立即生成可作的见解。他们是团队成员,不仅记住了 200 页战略文件中的所有内容,而且还了解它与昨天的客户会议和上个季度的财务业绩有何关系。当面临复杂的问题时,他们可以有条不紊地逐步解决解决方案,并在此过程中清楚地解释他们的思维过程,无论是帮助分析大量客户反馈以确定共同主题还是解决技术问题。可帮助您使用生成式 AI 的免费和低成本 AWS 课程指南超过 135 个 AWS 培训,适用于各种经验水平的所有人。直接来自源头,Writer 和 Palmyra X5 上的 AWSWriter 首席技术官兼联合创始人 Waseem AlShikh 表示:“我们选择 AWS 作为第一家从 Writer 提供完全托管模型的主要云提供商,因为它具有无与伦比的安全性,以及我们改变企业利用 AI 推动创新和增长方式的共同愿景。“Palmyra X5 是 Writer 迄今为止最先进的模型,能够以扩展多代理系统的关键速度处理大量企业数据。借助 Amazon Bedrock,我们可以将这些强大的功能交到全球更多企业手中,并使我们的客户能够在 Bedrock 安全、可扩展的环境中进行部署。基于我们与 Writer 的强大战略合作,AWS 很高兴通过 Bedrock 提供 Writer 的 Palmyra 模型系列,为世界各地的组织开启代理创新的新时代,“AWS Amazon Bedrock 总监 Atul Deo 说。“Palmyra X5 在长上下文输入下提供令人印象深刻的性能以及企业级的可靠性和速度。无缝访问 Writer 的 Palmyra X5 将使开发人员和企业能够构建和扩展 AI 代理,并利用 AWS 的安全性、可扩展性和性能改变他们对大量企业数据的推理方式。处理数字Palmyra X5 是市场上最高效的大型上下文 LLM 之一,针对速度和成本进行了优化。Palmyra X5 可以在 ~22 秒内吸收整个百万令牌提示,并且可以在 ~.3 秒内返回单个函数调用轮次Palmyra X5 在最新的 Longbench v2 评估中展示了一流的得分成本比,平均得分高达 53%,令人印象深刻。企业可以获得接近顶级的准确性,同时每百万个令牌支付的费用要少得多,从而在不超出预算的情况下实现大量代理和长上下文任务。它支持 30 多种语言,为全球企业提供真正的多语言功能。它的定价为每 100 万个输入代币 60 美元,每 100 万个输出代币 6 美元,使其成为市场上最具成本效益的大型上下文法学硕士之一。Palmyra X5 也是 BigCodeBench(完整、指令)评估中排名最高的模型之一,得分为 48.7,展示了其处理实际和具有挑战性的编程任务的能力。更大的故事虽然生成式人工智能正在改变我们创建、分析和与信息交互的方式,但代理人工智能将从根本上重塑工作本身的性质。人工智能的下一个前沿领域超越了内容创建和洞察生成,而是使用可以独立规划、执行和调整复杂作序列的人工智能代理。借助 Amazon Bedrock 中提供的 Palmyra X5,AWS 客户可以使用 Writer 的模型安全、私密地构建和扩展 AI 代理,而无需管理底层基础设施。对于各行各业的企业来说,特别令人兴奋的是,Palmyra X5 允许他们构建和部署更复杂的 AI 代理,这些代理需要大量数据,包括访问外部系统中的其他代理、LLM 和工具。跟随我们进入 AWS 设计定制芯片的实验室Annapurna Labs 独特的创新方法突破了计算机软件和硬件开发的极限。Writer 提供精确的、完全拥有的模型,这些模型从不经过训练后的量化或蒸馏,因此您今天验证的行为就是您明天将看到的行为。Palmyra X5 建立在这一承诺的基础上,具有严格的向后兼容性,使团队免于重新调整流程的痛苦,客户可以影响的已发布企业路线图,以及延迟优化推理,使 LLM 交互和检索增强生成 (RAG) 即使在百万代币规模上也能感觉瞬时。即将发生的事情Writer 宣布,它现在将 100 万个代币设置为其未来发布的所有 LLM 的最小上下文窗口大小,这要归功于新颖的 transformer 设计(一种可以同时而不是顺序审查输入数据的架构)和混合注意力机制(允许多种方式同时关注信息,以提高效率和效果)。这意味着企业可以围绕不断扩展的功能来规划其人工智能战略,而不受上下文窗口的限制。深入了解访问 AWS 新闻博客,了解有关 Palmyra X5 的更多详细信息,包括如何在 Amazon Bedrock 中部署模型和潜在使用案例,并查看 Amazon Bedrock 中的编写器产品页面。




 与 CNBC 的吉姆·克莱默 (Jim Cramer) 的对话.jpg)





