69年前的夏天,麦卡锡在达特茅斯学院的学术研讨会上第一次提出了“人工智能”的概念,同时也正式标志着AI的诞生,在随后的几十年间,随着神经网络、机器学习等方面的研究日趋完善,各类大模型纷纷落地,人工智能也真正意义上迎来了属于自己的高光时刻。正如冯·诺伊曼所说的,“技术的不断加速进步,将会引发人类历史上某个关键的奇点。”如今,我们比以外都更靠近那个改变历史的瞬间。
对众多企业而言,通过集成大模型来提升应用体验和功能深度已经成为了普遍共识,但“理想很丰满,现实很骨感。”一个摆在眼前的问题是,不同的企业有着不同的行业属性和落地场景,模型选的太复杂,可能会大材小用,选择能力不足的模型,则会白白浪费企业的成本投入。如何更好地管控模型使用、降低成本支出,并清晰地洞察AI使用现状和服务问题,成为企业构建AI应用的内在诉求。
2023年4月份,亚马逊云科技正式对外发布了Amazon Bedrock,并在随后的几个月时间里快速确立了包括基础设施层、模型工具层和应用层在内的生成式AI三层技术栈体系,树立了云端构建和使用生成式AI的新范式,并非常密集地进行了一系列的重大功能更新,其中,全托管式生成式AI服务Amazon Bedrock正是生成式AI三层技术栈中最重要的模型工具层。据亚马逊云科技CEOMatt Garman表示,如今,每天都有数以万计的客户在生产应用中使用Amazon Bedrock,仅在去年的使用量就增长了接近5倍。
在不久前举办的2024 re:invent期间,Amazon Bedrock更是一口气发布了21项新特性,从而让企业能够在兼顾规模与成本的同时选择最适合业务场景的大模型,并加快AI战略的落地。
模型选择全面升级
在亚马逊云科技成立之始,就明确了客户至上的理念,即开发者和客户永远有选择最优产品的权利,无论是上百款数据库,还是超过百款的EC2都在证明这一点,而在模型选择方面,这一理念同样奏效。
首先自然是对2024 re:invent期间推出的Amazon Nova系列模型的支持,其中包括文生文模型Nova Micro,低成本多模态模型Nova Lite,在准确性、速度和成本间实现平衡的Nova Pro、可处理复杂推理任务的Nova Premier、新一代图像生成模型Amazon Nova Canvas以及新一代视频生成模型Amazon Nova Reel,这些模型分别适用于不同的使用场景,并在多种任务中展现出顶尖的性能,且具备行业领先的性价比,特别是Amazon Nova Micro、Lite和Pro在各自的智能类别中,成本要比Amazon Bedrock中表现最佳的模型还要便宜至少75%,同时在包括伯克利函数调用排行榜、VisualWebBench网页浏览器操作基准测试、Mind2Web通用多模态代理基准测试,以及综合RAG测试中的各种行业基准测试中表现优异,并支持Amazon Bedrock的各种新特性。
此外,Amazon Bedrock也接入了众多行业上的领先模型,如能够依据文本和图像高效且以电影级质感生成高质量视频的Ray2,用于代码生成、测试、文档编制以及实时代码补全的malibu和point,以及能够依据各种风格的文本描述生成高质量图像的Stable Diffusion 3.5 Large等等。
为了全方位满足客户在不同场景的独特需求,亚马逊云科技还推出了Amazon Bedrock Marketplace,为用户呈上多达100 余种涵盖热门、新兴以及专业领域的多样化模型,如Mistral AI的Mistral NeMo Instruct 2407、Technology Innovation Institute的Falcon RW 1B以及NVIDIA NIM微服务、以及用于金融行业的Writer的Palmyra-Fin、用于翻译的Upstage的Solar Pro、Camb.ai的文本转音频MARS6以及用于生物学的Evolutionary Scale的ESM3生成模型等。
更低成本,更高效率
有一个行业内的普遍共识是,企业在选择模型时,往往会基于性能、功能和成本等方面进行权衡,根据不同的场景需求选择不同定位的模型。尤其是成本,在模型能力和用户体验相差不大的情况下,谁能用更低的成本提供服务,谁就占据了更大的优势。为此,Amazon Bedrock也在成本、速度和准确率等方面进行了全面优化。
在降低推理成本方面,Amazon Bedrock的提示词缓存、提示词智能路由、模型蒸馏三大功能可以有效降低成本,具体来说:
通过提示词缓存功能,可以有效减少重复处理且不会影响准确性,对于受支持的模型,该功能最高可将成本降低90%,并将延迟最多缩短85%。
借助提示词智能路由功能,客户能够在配置AmazonBedrock时自动把提示词分配到同一模型系列里的不同基础模型,以优化响应质量和成本,由于该功能可以预测每个请求对应的每个模型的性能,并将请求动态路由至最有可能以最低成本提供所需响应的模型,可在不影响准确性的前提下降低多达30%的成本。
而模型蒸馏功能则能把大模型的知识转移到小模型上,同时保留小模型的性价比,从而让客户在没有专业机器学习知识的前提下,根据自己的用例优化模型,以较小的模型满足在成本和延迟方面的要求。与原始模型相比,被蒸馏模型的速度可以提高500%,运行成本降低75%,在检索增强生成(RAG)等用例中,准确性损失仅不到2%。
此外,Amazon Bedrock还推出了低延迟优化推理功能,该功能基于Amazon EC2 Trn2实例,利用最新硬件和软件优化,可在多模型上实现更好的推理性能。用户指定推理请求优先级后,平台就可以自动处理,为支持的指定模型提供优化的性能。
知识库功能更新
针对基础大模型无法获取专属知识的问题,Amazon Bedrock的知识库功能可以让模型读懂用户专属的内容以扩充模型的知识面、从而提升生成结果的关联性和准确性。此次更新在以往众多不同的数据源接入的基础上,新增了结构化数据检索支持和图数据的支持,以及将非结构化多模态数据转换为结构化数据的新功能。
具体来说,通过结构化数据检索功能,客户能够直接查询生成式AI应用程序中结构化数据的存储位置,借助该功能,提示词信息也会转换为SQL查询,用于检索数据结果,同时,知识库还会根据客户的架构和数据进行自动调整,从查询模式中学习,并提供一系列定制选项,来进一步提高所选用例的准确性。
而对GrahpRAG的支持则能生成更具相关性的响应。客户可以在不具备图数据库专业知识的前提下,使用Amazon Neptune图数据库服务自动生成图谱,从而将不同的相关信息映射成网状结构来对数据间的关系进行建模和存储,并跨数据链接各实体之间的关系。
除此之外,Amazon Bedrock还新增了Amazon Bedrock Data Automation功能,它能够将非结构化多模态数据转换为结构化数据,用于生成式AI和分析。该功能可以快速从非结构化数据文件中提取信息,并将其转化为结构化格式,适用于智能文档处理、视频分析以及RAG等场景,并利用预定义的默认设置生成内容,比如视频片段每个场景的描述、音频的转录内容。客户也能根据自身数据架构生成定制化输出,轻松加载到现有数据库或数据仓库。
据悉,宝马集团即将为旗下的人工智能驱动的虚拟助手My AI Assistant(MAIA)实施GraphRAG,借助Amazon Neptune支持的GraphRAG自动化图形建模功能,宝马集团能够依据数据使用情况,持续更新MAIA所需的知识图谱,从其数据资产中提供更具相关且全面的洞察,进而持续为数百万车主打造优质体验。
新增自动推理检查功能
亚马逊CEO Andy Jassy在2024re:Invent演讲中提到“很多时候,人们用不错的模型做了些工作,就以为打造出很棒的生成式AI应用程序了,但实际上可能只完成了大概70%的工作,而客户不会喜欢那30%存在问题的应用程序。”
而在这30%的问题当中,尤以模型幻觉最难处理。虽然大模型的性能在不断进步,但即便是能力最强的模型也会产生幻觉,提供不正确或者误导性的响应,这在很大程度上会影响企业对生成式AI的性能。
幻觉虽然难以杜绝,但生成内容中的事实性错误却并不难发现。“以前大模型缺乏可证明事实的逻辑,导致出现幻觉时难以纠正。但有了自动推理技术,我们能够通过数学验证方式严密证明事实性错误是否会发生,从而有效改善幻觉问题。”亚马逊云科技大中华区产品部总经理陈晓建表示。
目前业界普遍认为,自动化推理检查功能是强大的生成式AI保护措施,可通过逻辑准确且可验证的推理来帮助防止因模型幻觉而导致的事实性错误,由于其运用数学来验证事情的正确性,因此在处理用户需要精确答案的问题时,自动化推理检查功能会带来更加精确的结果。
Amazon Bedrock Guardrails中就提供了这一功能,该功能可让Amazon Bedrock验证事实响应的准确性,生成可审计的输出,并向客户清晰展示模型得出结果的原因。这提升了透明度,确保模型响应符合客户的规则和政策。
以某健康保险提供商为例,该公司采用了生成式AI驱动的客户服务应用程序,在部署了AmazonBedrock后,提供商只需上传其政策信息,Amazon Bedrock便会自动制定必要的规则,并指导客户进行反复测试,以确保模型调整为正确的响应,在启用自动化推理检查功能后,Amazon Bedrock还会对模型生成的响应进行验证,如果响应不正确,Amazon Bedrock还会通过自动化推理检查功能中的信息来建议正确的响应。
多智能体协作提高效率
AI智能体作为将生成式AI能力应用于现实世界的重要途径,逐渐被越来越多的企业所重视,此前亚马逊云科技已经在Amazon Bedrock推出了智能体功能,使得客户能够跨公司系统和数据源工作,但如果要对数百或者数千个不同变量进行财务分析,单个智能体就无能为力了,然而,要想创建一个能够协调多个智能体、在智能体之间共享上下文并动态分配不同任务给相应智能体的系统也需要很多专业工具和生成式AI专业知识,这是很多企业所不具有的。
为了解决这一问题,亚马逊云科技扩展了Amazon Bedrock的智能体功能以支持多智能体协作,使客户能够轻松地构建和协调专业智能体来执行复杂的工作流程,凭借该功能,客户可以通过为项目的特定步骤创建和分配专用智能体,从而获得更准确的结果,并通过编排多个并行工作的智能体来加速任务。
信用评级和金融洞察领域的领导者穆迪公司已经选择Amazon Bedrock多智能体协作功能来增强其风险分析工作流程。具体来说,通过Amazon Bedrock创建智能体,并为每个智能体分配特定的任务,如A智能体用于分析宏观经济趋势、B智能体用于使用专有财务数据评估公司特定风险、C智能体用于考虑竞争和战略定位,这些智能体可以无缝协作,将输出结果综合成精确、可操作的洞察,从而为穆迪公司提供更快更准确的风险评估,巩固其作为金融决策领域值得信赖的权威机构的声誉。
正如亚马逊云科技人工智能和数据副总裁Swami Sivasubramanian博士所说的,“Amazon Bedrock拥有广泛的模型选择、领先的功能,使开发人员能够更轻松地将生成式AI集成到其应用中,并且注重安全和隐私。对于希望将生成式AI作为其应用和业务核心的客户来说,Amazon Bedrock已成为一个不可或缺的工具。因此,Amazon Bedrock的客户群仅在去年就增长4.7倍之多。随着生成式AI逐渐改变越来越多企业业务和客户体验,推理将成为每个应用的核心部分。随着此次新功能的推出,我们正在为客户进行创新,以解决整个行业在将生成式AI应用推向生产时面临的主要挑战,比如降低幻觉和成本。”
本文属于原创文章,如若转载,请注明来源:Amazon Bedrock再进化,亚马逊云科技打造生成式AI模型工具新典范https://cloud.zol.com.cn/939/9393132.html