热点:

    AMD通往现代数据中心的“罗马大道”

      [  中关村在线 原创  ]   作者:徐鹏

    当Lisa Su连续两次在舞台上坚定地喊出“Highest”时,现场爆发出热烈的欢呼声,这足以看出大家对新一代EPYC的期待,以及AMD的十足自信。旧金山当地时间8月7日,AMD正式发布了代号“Rome”的第二代EPYC处理器,基于7nm制造工艺的 “Zen 2”架构,至多搭载64颗核心的Rome在创下多项性能记录的同时,还在多种工作负载负载下,实现了最多将TCO降低50%。更重要的是,随着谷歌和Twitter的加入,AMD EPYC的朋友圈正变得空前壮大。

    AMD通往现代数据中心的“罗马大道”
    AMD EPYC Horizon

    一边是Intel,一边是NVIDIA,AMD在计算市场的日子一直面临着严峻考验,而在数据中心领域,AMD也是一路坎坷,甚至错过了x86在服务器市场的黄金时期,但上天总会眷顾持之以恒的创新者。在苏姿丰博士(Dr. Lisa Su)就任AMD总裁兼CEO之后,这家公司就加速驶入了快车道,“Rome”的发布更是唱响了AMD数据中心市场的最强音。

    AMD通往现代数据中心的“罗马大道”
    AMD总裁兼CEO苏姿丰博士(Dr. Lisa Su)

    “今天,我们正式发布第二代AMD EPYC处理器,为多种工作负载提供创纪录的性能,并显著降低总体拥有成本,为现代数据中心树立了新标准。随着越来越多的企业级、云和高性能计算客户纷纷采用第二代AMD EPYC处理器以满足其最苛刻的服务器计算需求,我们领先的服务器处理器正在加速部署。”在AMD EPYC Horizon的演讲中,Dr. Lisa Su兴奋地说道。

    7纳米的大杀器

    自“Naples”以来,EPYC就以其在多核心、高I/O带宽、高安全性等方面的竞争力赢得了一众客户,在云、HPC、AI等应用场景中对Intel造成了不小的威胁。重返服务器市场的EPYC凭借单位美元更领先的性能令人刮目相看,“单路打双路”的景象仿佛就在昨日,“Rome”则将目光望向了“现代数据中心的新标准”。转投台积电后的7nm制造工艺、64核心128线程、PCIe 4.0、增加4倍的L3缓存、双路至多4TB内存……几乎每一项数据都在展现着AMD的底气。

    AMD通往现代数据中心的“罗马大道”
    第二代AMD EPYC处理器

    与初代Zen架构相比,基于Zen 2的Rome利用14纳米工艺可将I/O独立出来变成了I/O die,与内存控制器、PCI-E 4.0控制器、互联控制器、L3缓存核心整合封装在中心部分,周围则是八颗7纳米工艺的CPU核心chiplet,每颗又可包括8个Zen2核心,较上代架构相当于单位CCX拥有4个核心,而两个又对应合成了一个CCD,这样在单颗处理器上的多个Die就能实现至多跨越到64核的不同组合。同时,把14纳米用在相对关键计算地位次之的I/O上也可以降低不必要的设计、制造难度,有效提升良品率。实际测试也证明,7+14纳米的思路做到了足够出色的性能表现。

    AMD通往现代数据中心的“罗马大道”
    chiplets的进化

    较上一代EPYC,Rome拥有更高的每周期指令性能以及I/O和内存带宽,每个插槽的计算性能提升2倍,每个插槽的浮点性能提升4倍,IPC性能在单线程下可提升15%,32核64线程下可提升23%。同等性能的情况下最多功耗可以降低一半,同等功耗的情况下,性能可以提升超过25%。此外,Rome支持多类型的8路DDR4内存,最高频率3200MHz,单个核心最高64GB。作为首款支持PCIe 4.0的x86服务器处理器(每路至多可支持128条总线),Rome实现了传输性能的成倍提升,并且带来了64GB/s的双向带宽。AMD还为Rome加入了供”硬核”芯片级嵌入式安全子系统,以及安全内存加密和安全加密虚拟化等高级安全功能,帮助客户保护重要的资产和数据。

    AMD通往现代数据中心的“罗马大道”
    首批出货的Rome型号

    首批出货的Rome产品共有19款,其中双插槽型号15款、单插槽型号4款,可以满足面向现代数据中心的工作负载需求。根据AMD给出的信息,Rome在企业数据中心较同类产品可带来83%的Java应用程序性能提升、43%的SAP SD 2 Tier性能提升。在HPC领域,Rome可在力学试验时提供两倍的计算流体力学性能,以及最高提升72%的结构分析性能。AMD称,EPYC 7002系列处理器共计创造了80多个性能世界记录。正因如此,Lisa Su才有底气的表示:未来几个季度要实现双位数的市场份额(服务器芯片市场)。

    AMD通往现代数据中心的“罗马大道”
    EPYC 7002系列处理器创造80多个性能世界记录

    独步天下的黑科技

    Zen可谓是真正从底层重新设计的处理器架构,无论是性能、能效、单/多线程能力等等都对Intel Skylake的强有力冲击。与Zen相比,Zen 2架构在多个方面都进行了增强,除了核心微架构升级,Zen 2还采用了革命性的“chiplet”模块化设计,实现了计算核心die和I/O单元die的分离。微架构上,L1缓存尺寸缩减一半、4-way变8-way的改变获得了op缓存尺寸翻倍,AMD称这样可以得到更优的性能。

    AMD通往现代数据中心的“罗马大道”
    创新的die设计理念

    AMD通往现代数据中心的“罗马大道”
    NUMA体系结构的进展

    至于chiplet,则被认为是半导体产业的一大趋势,简而言之这种技术就是把为实现特定功能的die通过先进的集成技术封装在一起形成SiP,chiplet可以看作是以硅片形式提供的IP,不同die之间再通过互联技术进行联接从而实现功能协同和数据交换。

    chiplet可以带来的好处有很多,灵活的工艺、架构选择可以在快速开发的同时,还能降低制造和使用成本。要知道,最新的工艺也意味着高风险,良品率就是一大挑战,因此针对特定应用去做定向搭配,无疑是最有性价比的,AI就是典型的场景。如何让不同模块在处理数据时发挥最好的协同性能?这就不得不提到Infinity Fabric了。

    AMD通往现代数据中心的“罗马大道”
    Infinity Fabric

    Infinity Fabric由SDF和SCF组成,对HyperTransport的理念实现了扩展,大幅缩短了SoC设计周期,可在多个处理器之间保持缓存一致性,像SDF就把内存一致性延伸到逻辑层,省去了HT的必要性兼容,on-die和off-die之间就可以自由连接。具体来说,在on die和off-die的SDF系统能够在多路连接的情况下维持数据传输的高拓展性,SCF则是把不同的SoC纳管在同一个系统中管理。Zen 2架构下的Infinity Fabric获得了全面提升,总线位宽升至512bit,在内存性能、缓存速度等方面均有不小的改善,并且率先支持了PCIe 4.0。

    要知道,AI、HPC、云计算等现代化工作负载对数据的高速处理有着严苛需求,16GT/s带宽的PCIe 4.0通道带来的性能提升是非常可观的,除了每通道带宽实现翻倍,也让Infinity Fabric在多处理器互联和外部连接扩展时更加游刃有余。至多128条总线的支持,可以大幅提升高性能显卡、联网设备、NVMe存储、局域网卡等设备的性能带宽,尤其是对存储设备带来的补强。

    AMD通往现代数据中心的“罗马大道”
    第二代AMD EPYC处理器

    生态为王吹响冲锋号

    当然,要想改变数据中心市场的游戏规则,没有生态只能是一纸空谈。在发布会现场,包括谷歌、Twitter、VMware、微软、HPE、联想在内的重量级合作伙伴表达了对EPYC的支持:谷歌宣布已经在内部基础架构生产数据中心环境部署了Rome,并将于今年晚些时候在云平台上支持基于Rome的全新通用计算机;Twitter则会在年底前在数据中心基础架构上部署Rome,从而减少25%的TCO;微软宣布即日起提供基于Rome的Azure虚拟机预览,以及基于云的远程桌面和高性能计算工作负载的限量预览;HPE计划通过更多基于Rome的系统将其AMD 平台的服务器产品系列扩大三倍,包括 HPE ProLiant DL385、HPE ProLiant DL325等;联想推出了基于Rome的ThinkSystem SR655、ThinkSystem SR635;VMware在在 VMware vSphere 内支持高性能的Rome的安全和其他特性;与Cray合作打造的E级超算……

    AMD通往现代数据中心的“罗马大道”
    Google&AMD

    AMD通往现代数据中心的“罗马大道”
    Twitter&AMD

    AMD通往现代数据中心的“罗马大道”
    HPE的Rome新品

    AMD通往现代数据中心的“罗马大道”
    面向HPC和虚拟桌面的微软Azure虚拟机

    AMD通往现代数据中心的“罗马大道”
    面向通用和内存密集型工作负载的微软Azure虚拟机

    AMD通往现代数据中心的“罗马大道”
    联想ThinkSystem SR635、ThinkSystem SR655

    无论是像技嘉和QCT等ODM,博通、美光、赛灵思等IHV,还是Canonical、RedHat、SUSE等Linux操作系统供应商,以及ISV、OEM等类型的合作伙伴,可以看到AMD的生态圈正在加速壮大。而这一成绩的取得,与AMD贴近客户需求持续创新密不可分,例如多核心多线程可以虚拟出更多的VM,使得CSP和互联网客户在获得高性能的同时有效降低数据中心的TCO。此外,AMD也在通过多种方式帮助客户在AI时代实现更好的性能表现。

    AMD通往现代数据中心的“罗马大道”
    第二代AMD EPYC处理器的生态伙伴

    “的确,AI现在是一个非常强有力的领域,而且它横跨很多行业领域。”在发布会后的媒体采访时,AMD全球副总裁兼数据中心产品部总经理Scott Aylor对笔者说,“我们将第二代AMD EPYC处理器与极高性能的GPU相连接,适用于训练的应用场景(training scenario)。此配置同时支持PCIe 4.0,相当于把连接到GPU的带宽加倍了,可以对机器学习和培训应用进行非常好的加速。”在发布会期间,AMD展示了一种参考设计(reference design),基于两个第二代AMD EPYC处理器的CPU,加上8个Radeon Instinct MI60 GPU,全部支持PCIe 4.0互联,可以大幅加速机器学习的效能。未来,AMD会将此参考设计提供给OEM厂商。

    更多的核心、更强的性能、更低的能耗和售价,这样的处理器平台谁不想要?更重要的是,AMD还在借助软硬件的生态协作实现创新。一个显著的例子是,从行业角度来看摩尔定律在变缓,每一代都实现更快的性能变得更难,而提升性能的主要途径就是增加核心数,这就少不了与软件生态系统的紧密合作。

    Scott Aylor谈到:“要确保软件应用能够非常好的利用到所有的核心增长,使软件设计非常好的利用到核心密度,这样就可以实现非常好的软硬件的结合。也就是说,在硬件上可以去增加很多的核心,但是同时要跟软件的合作伙伴非常紧密地合作,让软件要能够识别这些核心的密度,并且充分利用到这些多核心的效能。”

    7纳米的到来使得AMD在制造工艺方面领先了一个身位,生态伙伴规模的日益壮大也让EPYC有了更多的用武之地。在Intel 10纳米产品在数据中心市场规模应用之前,已吊足人们胃口的Rome有足够的时间证明自己,优秀的性能表现给这场“翻身仗”开了一个好头,而谁能够解决客户在现代数据中心时代多元化的新需求,无疑就将占得先机。

    AMD Ryzen Threadripper 2920X

    AMD Ryzen Threadripper 2920X

    [经销商] 京东商城

    [产品售价] 2899元


    本文属于原创文章,如若转载,请注明来源:AMD通往现代数据中心的“罗马大道”//cloud.zol.com.cn/724/7244507.html

    cloud.zol.com.cn true //cloud.zol.com.cn/724/7244507.html report 7570 当Lisa Su连续两次在舞台上坚定地喊出“Highest”时,现场爆发出热烈的欢呼声,这足以看出大家对新一代EPYC的期待,以及AMD的十足自信。旧金山当地时间8月7日,AMD正式发布了代号“Rome”的第二代EPYC处理器,基于7nm制造工艺的 “Zen 2”架构,至多搭载64颗核心的Rome在...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    0

    下载ZOL APP
    秒看最新热品

    内容纠错