热点:

    华为推AI训练集群Atlas 900 比世界纪录快10秒

      [  中关村在线 原创  ]   作者:徐鹏

    北京时间9月18日消息,在第四届华为全联接大会上,华为在首次发布计算战略,基于架构创新、投资全场景处理器族、有所为有所不为的商业策略、构建开放生态进行布局。同时,华为还发布了“全球最快AI训练集群”Atlas 900,在ResNet-50模型训练中,Atlas 900仅用59.8秒就完成了训练,比原来的世界纪录快了10秒。

    华为公布计算战略 推出AI训练集群Atlas 900
    华为副董事长胡厚崑

    两年前,华为发布了新的愿景使命,就是要“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。华为副董事长胡厚崑认为,智能世界有三个特征,就是万物感知、万物互联、万物智能,要支撑这样一个智能世界,有两个关键的技术需要持续创新和投资:联接和计算,“事实上,联接和计算这两大技术,就象一对孪生兄弟,相互促进、协同发展。可以说,在未来的智能世界里,联接到哪里,计算就到哪里,哪里有计算,哪里就有联接。

    过去十年, 华为一直在致力于对于计算产业的投资,并在这一进程中发现了计算进入智能时代的三个重要特征:需要超强的算力,统计计算本身就是一种暴力计算,高度依赖于算力;计算和智能将会无处不在,而不仅仅是分布在中心侧,从中心节点的暴力计算,到边缘侧的专业计算;端边云之间需要高效的协同,中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。

    根据Gartner给出的数据,预计到2023年计算产业的规模将超过2万亿美元。为此,华为将从四个方面展开布局:

    架构创新,用新的处理器架构来匹配算力的增速,同时适用华为自身覆盖端、边、云的全场景业务智能化需求,达芬奇架构的任务就是要实现计算和智能的无处不在。

    投资全场景处理器族,包括支持通用计算的鲲鹏系列、支持AI的昇腾系列、支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列,并将推出更多的处理器支持多样场景。

    商业策略,不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机,推动硬件开放(把服务器主板、AI模组和板卡等硬件开放给伙伴)、软件开源(把服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本)、使能应用开发和迁移(提供工具和团队,帮助伙伴更高效地做好应用开发和迁移)。

    构建开放生态,沃土计划在过去四年已发展130多万开发者和14000多家ISV,今天该计划迎来了升级,华为将继续投入15亿美元,使开发者的规模扩大到500万人,使能全球合作伙伴发展应用及解决方案。

    在本次华为全联接大会上,华为还重磅发布了搭载数千颗昇腾处理器的“全球最快AI训练集群”——Atlas 900。Atlas 900由数千颗昇腾910 AI处理器互联构成,总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。昇腾910 AI处理器采用SoC设计,集成“AI算力、通用算力、高速大带宽I/O”,大幅度卸载Host CPU的数据预处理任务,提升训练效率。

    华为推AI训练集群Atlas 900 比世界纪录快10秒
    Atlas 900

    据了解,Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,百TB全互联无阻塞专属参数同步网络,降低网络时延,梯度同步时延缩短10~70%。华为集合通信库提供训练网络所需的分布式并行库,通信库+网络拓扑+训练算法进行系统级调优,实现集群线性度>80%,极大提升了作业调度效率。

    Atlas 900 AI训练集群采用全液冷方案,以及柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持50kW散热功耗,实现PUE<1.1的数据中心能源效率。在空间节省方面,与8kW风冷机柜相比,节省机房空间79%。液冷散热技术满足了高功率、高密设备部署、低PUE的需求,大幅降低了客户的TCO。

    目前,华为已在华为云上部署了一个Atlas 900 AI训练集群,集群规模为1024颗昇腾910 AI处理器。基于当前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k数据集”,Atlas 900AI训练集群只需59.8秒就可完成训练,排名全球第一。“ ImageNet-1k数据集”包含128万张图片,精度为75.9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70.2s和76.8s,Atlas 900 AI训练集群比第2名快15%。

    为了帮助SKA射电望远镜解析超过20万颗星体,过去天文学家要从这20万颗星星中找出某种特征的星体,需要169天的工作量。现在用上Atlas 900,只用10秒,就能从20万颗星星中检索出了相应特征的星体,并实现精准定位。

    如今,各行各业数字化、智能化转型如火如荼,计算产业蓬勃发展。可以看到,华为始终在坚定不移地投入计算产业,从最难的架构突破做起,自研处理器,以此为基础打造产业,构建生态。“我们坚信,只有克服最大的困难,才能真正构建起竞争力,才能为行业伙伴打开更大的产业空间,我们要用最好的技术,解决世界上最难的问题,把不可能变成可能。”胡厚崑谈到,“这是计算产业新的大航海时代,我们期待的是千帆竞发,而不是独舟奋进。我们期望和各行各业的伙伴共同努力,抓住历史机遇,共创智能新高度。”


    本文属于原创文章,如若转载,请注明来源:华为推AI训练集群Atlas 900 比世界纪录快10秒//cloud.zol.com.cn/727/7272891.html

    cloud.zol.com.cn true //cloud.zol.com.cn/727/7272891.html report 4113 北京时间9月18日消息,在第四届华为全联接大会上,华为在首次发布计算战略,基于架构创新、投资全场景处理器族、有所为有所不为的商业策略、构建开放生态进行布局。同时,华为还发布了“全球最快AI训练集群”Atlas 900,在ResNet-50模型训练中,Atlas 900仅用59.8秒就完...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    周关注排行榜
    • 产品
    • 品牌
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错