“这是有史以来规模最大的亚马逊云科技盛会。”亚马逊云科技首席执行官Adam Selipsky说道。毫无疑问,re:Invent早已成为云计算行业最重要的活动之一,如今,这种影响力正在向AI领域深入传播。从金融行业的摩根大通、高盛、纳斯达克和万事达卡,到汽车行业的宝马、丰田、福特和梅赛德斯-奔驰,再到医疗保健行业的辉瑞、吉利德、默克、诺和诺德,都在使用亚马逊云科技的技术和产品加速业务创新。目前,全球有超过80%的独角兽企业是亚马逊云科技的客户。无论是大型的巨头公司,还是小型的创业公司,这些不同规模的企业都能从亚马逊云科技的平台上找到所需的技术和服务。正因如此,身处于AI爆发的时代,来自全球各地的人们都想来看看,亚马逊云科技如何在生成式AI的浪潮中继续“重构”。
亚马逊云科技首席执行官Adam Selipsky
根据高盛研究部的报告,生成式AI的突破会给全球经济带来巨大变化,这些技术进步引发的业务流程变革,可能会使3亿个全职岗位受到AI自动化的影响。随着更多以自然语言处理为核心技术的先进生产力工具被企业和社会采用,未来10年,全球年均GDP有望增长7% (约合近7万亿美元)。与此同时,全球的企业软件、医疗保健和金融服务等领域也将受到AI的深远影响。
在re:Invent 2023上,亚马逊云科技发布了Amazon S3 Express One Zone,这是一款旨在为客户常访问的数据提供最高性能和最低延迟的对象存储,可以提供个位数毫秒级延迟的性能,以支持每分钟数百万请求、每秒数十万次的数据访问,访问速度比Amazon S3标准版快10倍,请求成本降低50%,计算成本降低60%,适用于AI/ML的训练和推理、交互式分析等密集型任务的存储,支持按需伸缩和现有S3的API调用。通用处理器Amazon Graviton4带来了更好的能效表现和性价比,相较Graviton3的计算性能提高30%,核心增加50%,内存带宽增加75%,对数据库和Java应用等关键工作负载有着更为显著的性能提升,分别提升40%和45%。R8g(已提供预览)是第一个基于Graviton4的实例,比R7g实例多出3倍vCPU和3倍内存,可以在处理大规模数据、实时数据分析、扩展负载时缩短时间,进一步降低TCO。
Amazon S3 Express One Zone
Amazon Graviton4
三层架构的生成式AI堆栈
重构,正在发生,这一次亚马逊云科技的目标是生成式AI。事实上,随着云计算市场的发展进入成熟期,企业已经将更多的投资转向AI。为了抓住这一巨大的机遇,亚马逊云科技希望在三个层级构建生成式AI的技术堆栈——底层是训练和推理的基础设施层,中间层是模型工具层,上层是应用层。在该架构中,亚马逊云科技会充分发挥自研的优势,通过芯片、模型、数据、服务等整体能力,更好的平衡AI构建所需的各种成本,针对不同需求提供相应的产品,满足客户对于灵活性、开放性、安全性的要求。当然,亚马逊云科技依然与Anthropic、NVIDIA等厂商保持着持续紧密的合作。
亚马逊云科技的生成式AI三层技术堆栈
在基础设施层,可以提供GPU、推理芯片Inferentia、训练芯片Trainium、SageMaker、UltraClusters、EFA、EC2 Capacity Blocks、Nitro、Neuron。例如,用于机器学习的EC2 Capacity Blocks可部署在UltraClusters中,与EFA网络互联,能够帮助客户将数百个GPU扩展到单个集群,供其按需使用。为了给客户带来更多选择,亚马逊云科技还推出了Inferentia和Trainium,前者于今年早些时候上线了第二代芯片,Inferentia2支持的两个实例提供了EC2中最低成本的推理,以及比INF1实例高出4倍的吞吐量和低10倍的延迟,后者则在re:Invent 2023上迎来了更新,相较于第一代芯片,Trainium2的训练性能提高4倍,内存容量提高3倍,能效(性能/瓦特)提高2倍,将在Amazon EC2 Trn2 实例中上线,单个实例包含16个Trainium芯片,Trn2实例可帮助客户在下一代EC2 UltraCluster中扩展到10万个Trainium2芯片,通过与EFA互联,可以提供65 EFlops的计算能力,适用于训练具有数千亿甚至数万亿参数的基础模型。借助软件开发工具包Neuron,客户可以从机器学习芯片中获得更优的性能,Neuron已支持TensorFlow、PyTorch等机器学习框架,并即将支持JAX。
Amazon Trainium2
在模型工具层,Amazon Bedrock支持Stability AI、AI21 labs、Anthropic、Cohere、Meta,以及Amazon(Titan)等各类大规模语言模型或基础模型,为客户带来了更多的开放选择,已经吸引了超过1万名客户使用,这些企业通过API可以自由调用模型的各种潜力。同时,Amazon Bedrock还提供了微调、RAG和持续预训练的功能,让企业构建应用时可以获得高度的定制化能力。例如,通过微调,客户可以将模型指向Amazon S3中标记的数据示例,以提供上下文,模型会根据这些行为进行学习,找出重要信息,然后Amazon Bedrock会复制基础模型,对其进行训练,创建一个私有的精细调整模型,这样,客户就能得到定制化的结果。微调可以在Amazon Titan Text Lite和Express中使用,适用于Cohere Command Lite和Meta LLaMA 2,即将应用到Anthropic的Claude上。基于Amazon Titan大模型的预训练,则可以提高模型的知识和推理能力。此外,Agents for Amazon Bedrock的正式可用,将进一步降低客户在使用模型时的复杂度,并且结合Guardrails for Amazon Bedrock,可以根据应用程序需求和政策定制保障措施,跨基础模型,为所有应用程序提供一致的AI安全级别,阻止生成式AI应用程序中不需要的话题,根据AI策略过滤有害内容。Adam Selipsky重申:“亚马逊云科技提供的是负责任的AI。”
Amazon Bedrock更新
Guardrails for Amazon Bedrock
在应用层,Amazon CodeWhisperer通过近乎实时地生成代码建议,帮助客户更快、更安全地构建应用程序。结合定制化的功能,其可以在内部代码库中学习,提供针对性的建议,创建对SDK、API、语言和类的理解,提升任务效率。更进一步,为了帮助企业中不同岗位和角色的用户安全构建生成式AI应用,亚马逊云科技重磅推出了企业应用助手Amazon Q,其融合了亚马逊云科技17年来积累的知识和经验训练,与40多个流行的企业系统建立了连接,通过自然语言交互帮助各类人群快速上手各种技术和解决方案,在业务构建、敏捷开发、故障排除、优化负载、任务执行等方面节省大量的时间成本。例如,Amazon Q Code Transformation可以自动完成从开发语言确定升级到强制代码包存储库和框架的路径,到替换已弃用的代码并合和安全的最佳实践。通过Amazon Q Code Transformation,一个小型的Amazon开发团队在两天内就成功地将1000个应用程序从Java 8升级到Java 17。
Amazon Q发布
除此之外,Amazon Q也为Amazon QuickSight、Amazon Connect提供全新基于生成式AI的助理。借助QuickSight中的Amazon Q,客户可以访问由生成式AI驱动的功能,由此来构建仪表板,并更轻松地利用数据简化决策、与业务利益相关者同步信息并获取洞察。Amazon Connect中的Amazon Q可以根据客户与客服之间的实时对话检测客户问题,自动回复、给出建议以及提供相关资料,通过让客服人员能够在没有主管协助的情况下满足客户对各种问题的需求,提高了客户满意度,减少了客服人员培训、解决问题的时间。借助Amazon Supply Chain中的Amazon Q(即将上线),客户能够提出有关供应链数据的一系列问题,Amazon Q会分析客户的供应链,例如标注大部分订单目前都在东海岸,风暴导致了延误,客户可以选择运往纽约而不是迈阿密来加快交货速度并降低成本。
企业级的生成式AI助手
AI生态的最佳实践
与合作伙伴的紧密协作,让亚马逊云科技在AI领域的创新更具吸引力。当前,GPU仍然是AI基础架构的核心组成部分。亚马逊云科技是第一家将NVIDIA GPU带到云端的企业,也是第一家提供NVIDIA V100 GPU、A100 Tensor Core GPU、NVIDIA H100 GPU的云计算服务商,这些高性能的GPU与EC2超级集群通过EFA连接高效结合,可以提供3200 Gbps的网络速度,使得客户能够在单个集群中扩展到2万个GPU,提供20EFLOPS的计算能力。在re:Invent 2023上,亚马逊云科技成为第一家推出NVIDIA GH200 NVL32实例的云厂商,这款实例带有32个GH200超级芯片,它们之间通过900GB/s NVLink网络互联,形成一个具有20TB共享内存的实例,可用于加速训练具有1万亿参数的AI大模型。
同时,亚马逊云科技还引入了NVIDIA DGX Cloud,并介绍了由GPU驱动的AI超级计算机Project Ceiba——采用GH200 NVL32和EFA互联的大规模系统,配备16384颗NVIDIA GH200超级芯片。Amazon EC2 P5e、G6和G6e实例也将上线。NVIDIA创始人兼首席执行官黄仁勋表示:“生成式AI正在改变云工作负载,并将加速计算作为多样化内容生成的基础。在向每位客户提供经济高效、先进的生成式AI的共同使命的推动下,NVIDIA和AWS在整个计算堆栈上开展合作,涵盖AI基础设施、加速库、基础模型和生成式AI服务”。
亚马逊云科技首席执行官Adam Selipsky与NVIDIA创始人兼首席执行官黄仁勋
通过与Anthropic建立新的合作关系,后者将利用亚马逊云科技的专用机器学习芯片Trainium来训练他们的下一代Claude模型。Amazon Bedrock的客户还将享有独家早期使用权,体验其他地方无法使用的Claude定制和微调模型功能。在达美航空,他们正在使用Amazon Bedrock定制生成式AI应用来为客户提供现代化的服务,通过访问旅行政策、实时航班时刻表、客户改签选项和机场状况,以高度关联和对话式的风格回答问题。Amazon Bedrock为达美航空提供了Claude 2.0、Claude Instant、Amazon Titan Text Express等不同的基础模型。
亚马逊云科技首席执行官Adam Selipsky与Anthropic联合创始人兼首席执行官Dario Amodei
辉瑞正在利用数字技术和数据能力加速业务创新,这种理念已贯穿于其36家工厂和所有的业务部门。辉瑞首席数字和技术官Lidia Fonseca表示:“我们今天的成功取决于我们为技术和人工智能的蓬勃发展奠定的基础,包括我们的数据、创建标准平台、培养强大的人才,并建立安全的基础,都是为了创新以获得最大的成果。如果没有与亚马逊云科技的密切合作,我们不可能实现如此巨大的影响力。”
亚马逊云科技与辉瑞的合作
2019年,辉瑞和亚马逊云科技创建了开创性的科学数据云,聚合了来自数百种实验室仪器的多模态数据,使科学家能够实时搜索所有历史分子和化合物数据,通过AI算法加速分析和计算研究,帮助识别和设计出最有前途的新分子。2020年,辉瑞在42周内把12000个应用程序和8000台服务器的资源迁移到亚马逊云科技,每年节省了4700万美元,减少了4700吨二氧化碳排放量。
Pfizer辉瑞首席数字和技术官Lidia Fonseca
当新冠疫情来袭时,辉瑞利用数以万计的EC2实例加速了药物制造和临床实验,亚马逊云科技为其提供了额外的CPU和容量支持,使得辉瑞从宣布计划与BioNTech合作开发COVID-19疫苗到获得FDA的紧急使用授权,只花了269天,而这通常需要8-10年的时间。在Amazon Bedrock和Amazon SageMaker的帮助下,辉瑞可以在研发、制造、营销等各种场景中快速实现需求,包括实现新的肿瘤靶点、提高科研成功率,以及检测操作异常、搜索潜在收购标的等。
宝马正在与亚马逊云科技合作重塑驾驶和乘车体验,改善工作流程,以严格的数据隐私标准来汇集车载数据。例如,利用Amazon SageMaker支持自动驾驶平台,加快开发、仿真和验证的过程,并在未来提供实时的交通运算功能。过去三年,宝马将互联汽车堆栈迁移到亚马逊云科技,现在每天需要使用1000多种不同的微服务管理超过 120亿个请求,处理超过110TB的数据流量。在全球范围内,宝马有8500多名开发人员为连接基础设施创建代码,例如宝马7系运行在超过5亿行代码上,宝马的数据中心每天会使用60000多个虚拟CPU执行110多个软件构建,可以借助Amazon EC2进行临时开发和测试,并远程分发给全球的开发团队,改善跨职能协作效率。
宝马集团互联公司开发和技术运营高级副总裁Stephan Durach
在AI浪潮中把握数据价值
“你的数据就是你的差异化因素。”Adam Selipsky强调了数据的重要性。在生成式AI的时代,数据就是一切。从Amazon S3到关系数据库(Amazon Aurora等)和非关系型数据库(Amazon DynamoDB),再到分析和管理服务,包括Amazon Redshift、Amazon EMR、Amazon OpenSearch Service等等,亚马逊云科技提供了全面的云数据服务集合。在re:Invent上,亚马逊云科技宣布了4项新的Zero-ETL集成功能,使客户能够快速、轻松地连接和分析数据,无需构建和管理复杂的提取、转换和加载(ETL)数据管道——Amazon Aurora PostgreSQL、Amazon DynamoDB、Amazon RDS for MySQL与Amazon Redshift数据库的集成,以及Amazon DynamoDB与Amazon OpenSearch服务的Zero-ETL集成。
Zero-ETL的集成
企业的各种复杂数据往往分布在各项业务场景中,彼此孤立,相互之间的调用、移动、转换、加载都是较大的工作量。对于开发人员来说,他们要设计ETL流水线架构,决定从哪里提取数据,而数据通常有多个来源,之后开发人员要编写代码转换数据、删除重复项、过滤异常值、检索缺失的数据、识别损坏数据。加载到新的位置后,还要编写更多的代码,数据工程师可能还会交换数据表或添加新字段,然后再次修改和更新代码……有了Zero-ETL之后,这些问题就会迎刃而解。
全新的集成功能可以帮助客户轻松连接和分析来自Amazon Redshift中多个关系和非关系数据库的事务数据,使用Amazon OpenSearch Service对DynamoDB数据近乎实时地执行全文和矢量搜索。客户可以使用Amazon Redshift和Amazon Athena中的联合查询功能(直接查询存储在运营数据库、数据仓库和数据湖中的数据),以及Amazon Connect分析数据湖(访问联络中心数据分析和机器学习。该服务还包括Salesforce Data Cloud与AWS存储、数据和分析服务之间新的Zero-ETL集成,使客户能够无缝地统一Salesforce和AWS之间的数据,以获得更优质、更快速的洞察。
数据治理同样关键。亚马逊云科技还发布了由生成式AI驱动的Amazon DataZone智能推荐功能,旨在大幅减少为组织数据提供上下文所需的时间。该功能由Amazon Bedrock的模型提供支持,可以生成数据资产及其模式的详细说明,并提出分析用例,只需单击一下,即可生成全面的业务上下文。
在re:Invent 2023上,Adam Selipsky还讲述了AI人才培养(AI Ready)和Project Kuiper(私有卫星网络连接服务)的新进展。到2025年,亚马逊云科技将免费培训2900万人掌握云计算技能,还会为另外200万人提供免费的人工智能技能,帮助世界各地的学生学习基础技能,为从事科技领域的职业做好准备,并为此创建了一个人工智能和机器学习奖学金基金,还推出了100种不同的AI/ML课程和资源。在Project Kuiper服务中,亚马逊云科技通过持续把卫星集合在一起,形成全球的高速卫星网络服务。数周前,Kuiper团队已经把第一颗卫星发送到了轨道上,未来将允许客户将数据从远程位置直接把数据传入到亚马逊云科技,而无需借用公共互联网。据了解,早期使用者将能够在2024年下半年开始测试。
Project Kuiper
结束语
可以看到,数据创新和围绕生成式AI的大力投入是亚马逊云科技在AI时代继续领跑的信心所在,这一切的来源,正是其源自其以客户为中心的思考方式。“重塑是我们的DNA,它每天都在驱动着我们。”Adam Selipsky表示,“我们的客户们正在解决重大问题,满足关键需求,构想世界上的下一个重大创新。他们需要我们提供安全、可靠、快速创新的服务,以服务他们的客户,并开启新的方式来增长他们的业务,所有这些都建立在亚马逊云科技之上。”
本文属于原创文章,如若转载,请注明来源:re:Invent 2023:在AI时代解锁数据的新价值 重构生成式AI的新可能https://cloud.zol.com.cn/844/8446262.html