云计算
    作者:徐鹏

    当超算与AI迈向融合 看联想HPC的速度和深度

         [ 中关村在线 原创 ] 暂无评论

        摩尔定律推动计算能力以指数级的速度递增,直接刺激了数据驱动人工智能的发展。借助HPC,机器可以对海量数据进行持续计算和自学习,再结合蒙特卡洛树等算法的不断优化,才出现了AlphaGo接连战胜李世石、柯洁等顶尖围棋高手的现象级事件。当然,HPC与AI的融合绝不仅限于下棋,要想基于算法、数据、计算力带动传统产业升级,离不开完善的HPC生态解决方案,这样才能让超算不仅“跑得快”,还能“用得好”。

        10月19日,由中国计算机学会主办的2017全国高性能计算学术年会(HPC China 2017)在合肥开幕。联想数据中心业务集团全球高性能计算与人工智能技术高级总监Scott Tease表示,作为全球增速最快的HPC供应商,联想正在帮助全球客户解决HPC领域的诸多挑战。面对即将到来的E级计算,联想将以其开放的生态圈、可扩展的基础设施、温水水冷技术、智能超算平台和分布式存储解决方案,以及HPC专家团队助力客户创新发展。

    当超算与AI迈向融合 看联想HPC的速度和深度
    2017全国高性能计算学术年会(HPC China 2017)

    HPC与AI的融合与演进

        得益于云计算、物联网等技术的成熟,人工智能在语音识别、图像处理、计算机视觉等方面逐渐解放了传统生产力,虚拟和物理世界的边际变得越来越模糊。目前来看,深度学习可以说是超算与人工智能结合点,一方面前者能够利用神经网络训练机器模型,赋予其逻辑能力,另一方面这种训练也需要强大的计算力支持,让模型算法更快、更精准。

        普华永道预计,到2030年人工智能将推动全球生产总值增长14%,贡献15.7万亿美元的经济价值。从地域分布来看,中国和北美有望成为最大受益者,总获益约为10.7万亿美元,占全球增长比例的近70%。这表明,中国在AI领域的技术和应用积累正趋于成熟,而AI的普及也将拉动消费和产业升级。

        Scott Tease认为,AI和HPC有着天然的联系,“二者的硬件系统有着很多相似性,比如都需要高性能的网络和大型GPU技术架构。得益于这种联系,使得联想HPC可以迅速切入AI。起初,HPC能帮助AI更好地发展,随着AI不断成熟,反过来也可以促进HPC部署和应用。因此,二者是一个相互改变、相互促进的关系。”

    当超算与AI迈向融合 看联想HPC的速度和深度
    联想数据中心业务集团全球高性能计算与人工智能技术高级总监Scott Tease

        GPU的加速特性让其在AI和超算界焕发了第二春,NVIDIA更是靠GPU打了一场惊艳的翻身仗。毋庸置疑,GPU架构对AI的适应性已被广泛认可。AI的应用效果取决于对海量数据的计算和分析,显然运算速度要比精度更重要,毕竟这种重结果导向的逻辑不是数字统计,只要一个高相似度就可以了,而传统CPU的双精准核对会在速度上打折扣。

        “HPC高性能计算集群对GPU的采用率已经从5%提升到10%-15%,甚至更高。”ScottTease说,“当然GPU也有一些局限性,导致有些客户现在还不会选择GPU,但是不管怎么说,我们看到GPU的应用越来越广泛,而且它已经有了更多、更好的应用。”

    联想AI的全球化与纵深

        今年7月,国务院印发了《新一代人工智能发展规划》,提出到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为我国产业升级和经济转型的主要动力,智能社会建设取得积极进展。在联想数据中心业务集团中国区企业营销产品营销总监李炜看来,传统行业对于新技术的挑战是不一样的,为此联想会对各行业进行相对应的智能化分析,并且根据需求做垂直化的二次细分,结合企业的迫切程度和本身业务帮助他们拓展AI场景。

    当超算与AI迈向融合 看联想HPC的速度和深度
    联想数据中心业务集团中国区企业营销产品营销总监李炜

        也就是说,联想会按照客户所在领域分析行业特点、环境特点、工作流程特点,之后将自身的软硬件产品进行定制化交付。期间,联想还会与行业专家合作,深入理解所在行业的架构、软件、开发等需求,帮助客户把AI部署到业务流程的每个环节。事实上,很多传统行业并没有意识到他们可以利用更前沿的技术改造生产流程,而这也是联想的机会所在。

        与传统行业相比,互联网行业都是主动拥抱新技术,而非被动应变。通常,互联网客户的需求是向上层倾斜的,并不局限于底层的基础设施,这也使得他们更关注网络带宽、弹性扩容等问题,以及数据中心的整体性能。

        李炜透露,联想在多年前就成立了超大规模计算事业部,正服务于全球七大数据中心中的六个,“这是我们多年来在互联网领域持续耕耘的结果。一直以来,我们都是主要互联网公司从一线二线到三线的主要合作伙伴和供应商之一,无论是研发资源投入还是客户获取都能够证明。”

        为了进一步推动人工智能战略,联想还在全球部署了三大AI创新中心,分别位于中国北京、美国莫里斯威尔、德国斯图加特,为客户搭建了新技术的试验田,合作伙伴包括英特尔、英伟达、IBM等,以及一些行业专家。“客户一旦有了新的想法需要做测试,就可以来我们的AI创新中心,他们可以运用联想的系统、技术进行数据处理,通过将软件和硬件相结合解决问题。”Scott Tease说。

    践行HPC生态的意义

        纵观科技发展史,每一项革命性技术的诞生都与科研院所和高校有着千丝万缕的联系。对于联想来说,其不仅与很多高校保持了多年的合作关系,还吸收了不少来自跟高校和科研机构的创新技术。在联想全球HPC业务中,高校和科研机构的应用部署合计份额占到30%到35%左右。

        近日,联想携手中国科学院数学与系统科学研究院打造了全新高性能集群项目,该集群采用了联想HPC整体建设方案,拥有408个计算节点,实现超出客户预期三倍的每秒1081万亿次的运算速度。此外,联想还提供了包括NVIDIA GPU、英特尔Xeon Phi在内的异构计算平台、基于联想LEAP的大数据分析测试平台、LiCO集群调度和管理系统,并参与实施了从机房规划、建设到整机柜交付的全周期工程,为用户提供一站式交钥匙解决方案,满足了HPC系统未来五至七年的使用需求。

        来自中国科学院数学与系统科学研究院的崔涛老师介绍称,选择联想合作HPC项目主要考虑到两个方面:功耗要低、运维费用要低。首先,中科院实验室机房的设计电量功耗有限,使得引入新电缆衔接园区变电站变得较为复杂。其次,运营费用也是一笔不菲的开销,因此要在尽可能低的功耗下达到最高的性能。“特别让我们惊喜的是,这套HPC最后超过400个节点,达到了现在的1000个P,是我们上一代机器的大概50倍,上上一台的1000倍。”崔涛说。

    当超算与AI迈向融合 看联想HPC的速度和深度
    中国科学院数学与系统科学研究院崔涛

        李炜表示,联想会更多关注基础算法的研究,包括针对国家重大的典型战略需求急性应用实践,目前主要是在环境、能源等方面。同时,联想也在与合肥物质科学院等离子所进行合作。“高性能招标有两类,除了预算的招标,还有计算能力的招标,就是在额定范围内看谁能提供最高的计算能力。以北大为例,如果以计算能力招标,水冷的机器招标一定是有很大的优势的。”李炜说。

        前不久,联想向北京大学交付了全新高性能计算校级公共平台集群。该集群系统理论计算峰值高达411万亿次/秒,计算节点理论峰值261万亿次/秒,实测计算能力达到242万亿次/秒。同时,联想还采用了45℃温水水冷技术,将集群PUE值控制在1.1,LINPACK效率达到92.6%,五年内可以为北京大学节省电量200万度。

        李炜称:“由于水冷功耗比较低,可以让CPU和GPU达到超频状态,使得每个节点增加30%的计算能力。联想的水冷为什么用温水而不用普通的水呢?温水水冷的特点是不会有水珠出现,避免了机器短路。对于解决E级计算等难题来说,水冷是一个很大的技术创新。”总结起来,联想的水冷方案主要体现在三个方面:运行效率比风冷高、能耗低、允许CPU持续超频。为了控制初期建设成本,联想还为北大搭建了一个水循环体系。算上HPC集群,整机交付一周左右就能完成部署,之后每次扩容只需要很少的预算。

    结语

        凭借多年来在高性能计算领域的研发与实践,联想已经形成了一整套HPC产品与行业解决方案,并且独创了温水水冷这样的黑科技。不过,高性能计算的演进之路从来不是一家领跑,而是需要构建从研发到落地的一体化交付和应用体系,只有这样才能让超算告别阳春白雪,找到真正的用武之地。在HPC与AI融合的这条路上,联想已经走出坚实的一步。

    周关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询