云计算
    作者:徐鹏

    从领跑TOP500看联想企业级的新动能

         [ 中关村在线 原创 ] 暂无评论

        淘金者、康乃馨、啤酒节......过去提到丹佛,或许浮现在你脑海里的是这些关键词,不过随着两次移民潮和经济发展愈发多元化,丹佛的主要产业开始逐渐渗透到金融、生物科技、信息科技这些前沿领域。如今,丹佛再一次成为全球的焦点:美国当地时间11月13日,第50期TOP500正式在此公布,中国HPC系统上榜数量达到202套,实现了对美国(143套)的大幅超越,神威·太湖之光蝉联榜首。此外,联想上榜的系统数量达到87套,连续四届获得TOP500中国第一、全球第二。更重要的是,这家全球成长最快的超算供应商,正在与AI摩擦出越来越多的火花。

        回顾中国HPC的发展之路,并非一帆风顺,从天河系列的70%国产化,到神威蓝光的85%以上,再到完全自主、耗时三年研制的神威·太湖之光,中国超算在美国芯片禁运的“倒逼”下跨出了历史性的一步。如果翻看中美在TOP500榜单上的角力,就会发现两国的差距自1993年开始一直处于比较大的情况,直到2016年6月的ISC迅速拉近。那一次,联想可谓用一己之力帮助中国HPC份额迎头赶上,而在那之前的四年,联想HPC上榜数量始终保持着正增长。爆发,总是源于长期的坚持。

        早在2001年4月,联想就成立了高性能服务器事业部,相继研发出中国第一个万亿次、四万亿次、十万亿次、百万亿次的超算集群,从深腾系列到GPU+CPU异构架构HPC,再到LiCO智能超算平台和温水水冷技术,联想在超算领域的探索从未止步,连续多次在中国载人航天项目中提供了定制化的解决方案。可以说,联想HPC的成果都是一步一步实践出来的。

    从领跑TOP500看联想企业级的新动能
    联想亮相SC 2017

        如今,摩尔定律推动计算能力以指数级的速度递增,直接刺激了数据驱动人工智能的发展。借助HPC,机器可以对海量数据进行持续计算和自学习,再结合蒙特卡洛树等算法的不断优化,才出现了所谓的AlphaGo。当然,就像AlphaGo的目的不只是下围棋,计算的价值也绝非计算本身,而是为工业、气象、航天、军事、医学、科研等领域提供切实可行的实际应用。不过,随着各行业的需求不断细分和深入,单靠计算力已难以满足业务目标,如何让计算变得更智慧成为IT厂商需要思考的问题。

        正如联想集团执行副总裁、数据中心业务集团总裁Kirk Skaugen所说:“人工智能已经对传统业务战略和科学研究产生了深远影响,大多数企业已将其视为未来优先发展的重要方向。但要真正从海量数据中获益,客户必须将人工智能作为一种手段,帮助其在竞争激烈的商业环境中取得成功。借助联想全新设立的全球人工智能创新中心和全面的产品与服务组合,我们将能够帮助客户轻松完成人工智能部署。”

    从领跑TOP500看联想企业级的新动能
    联想集团执行副总裁、数据中心业务集团总裁Kirk Skaugen

    HPC是智慧化的基石

        从深腾1800到深腾8810,十多年积攒的经验不仅体现在运行速率提升,还有模块化设计、软件升级,以及对人工智能的支持。作为HPC+AI智能超算平台,LiCO在HPC软硬件平台上整合支撑了各种深度学习应用,融合了主流的人工智能框架,例如Tensorflow、Caffe、MXNET等。同时,LiCO分布式的资源调度系统,可以帮助用户应对深度学习训练不断增长的计算需求,而端到端的解决方案包含数据预处理、训练、参数调整、过程监控、测试等,能够让用户专注在AI算法和业务应用上。LiCO不仅可以提供易用的可视化操作界面,降低使用和管理门槛,还对联想旗下对各种刀片和机架服务器具有广泛适用性,并且是全球通用的。

        如果说LiCO是联想的软件创新,那么温水水冷则是硬件黑科技。NeXtscale System在全球率先采用了45摄氏度的温水水冷技术,PUE可以达到1.1,能效比风冷系统降低40%,比其他厂商的水冷技术低20%,1米内噪音低于50分贝,也就是卧室的静音效果。第二代水冷的散热效率可以达到90%,做个比喻,如果用现有技术做10倍于太湖之光性能的机器,可能要动用一个中型发电站,如果采用联想的水冷技术,可以压缩90%的能耗和占地面积。或许有人会问,这么高的散热效率是不是只会停留在实验室里?事实上,联想已经在北京大学交付了中国第一套超大规模温水水冷超算集群,LINPACK效率达到92.6%,PUE值低至1.1,五年可以节省电量200万度。

        调研机构IDC预测,2019年全球HPC市场将达到152亿美元的规模,其中中国市场将成为主要角逐之地,一方面原因是互联网公司对于数据处理的需求与日俱增,另一方面是HPC在垂直领域的应用场景也越来越丰富。例如,联想为中国科学院数学与系统科学研究院打造的一站式高性能集群,是国内首个基于Purly平台的HPC,拥有408个计算节点,实现远超客户预期三倍的每秒1081万亿次的运算速度,可以确保整套系统在未来5-7年内稳定运行。在TOP500逐渐成为超算竞技场的今天,如何将超算“用得好”无疑更重要,这也是为何戈登贝尔奖如此重量级的原因。

    从领跑TOP500看联想企业级的新动能
    ThinkSystem SR650

        对于联想来说,HPC的发展之路并不是一味追求GPU跑分,毕竟有些运行环境无法达到百分之百的性能释放,即使进入TOP500也没有应用意义。联想要做的是根据客户的需求进行设计,搭配自家的软件,找到性能和成本的平衡点,并且让客户进行动态调整。与其他厂商相比,联想的优势在于完全自主研发,而且随着成本下降和性能提升,联想HPC的应用将取得快速成长。与此同时,销售渠道和管理体系在HPC的增长过程中,也会有强劲的发展。Kirk透露,联想的毛利水平几乎是竞争对手的两倍,没有必要发起价格战,而是要通过产品创新来赢得客户。

    AI是HPC的升华剂

        普华永道预计,到2030年AI对全球经济的贡献将达到15.7万亿美元,进而推动当年的全球GDP增长14%。另一项调查显示,76%的受访者表示人工智能是其运营战略成功的基础,而64%的受访者认为该技术对其企业的长期发展至关重要。为了抓住这一机遇,联想不仅在美国北卡罗来纳州莫里斯维尔、德国斯图加特和中国北京建立了三个新的人工智能创新中心,还将向AI领域投资12亿美元。联想客户能够远程使用创新中心服务,并有机会在专为高性能优化的多种系统上测试和优化应用与工作负载。

        此外,联想100多名数据科学家和专业人工智能开发人员正在研究支持人工智能的解决方案,例如患者影像扫描,以检测和分类肿瘤,并协助医生进行诊断。考虑到大部分AI应用仍依赖于正在开发的智能环境,联想将从发现、开发、部署三个方面,结合“ABC(算法、大数据、计算力)”战略,帮助客户快速将AI落地。当然,联想也深知要想打造HPC+AI生态圈不能靠一家之力,需要加强与产业链上下游厂商的合作,包括硬件层面携手英特尔、英伟达、Mellanox,软件层面主动开放生态系统,吸引主流软件厂商(如红帽)加入联盟,以及创投集团投资一些具有潜力的科技创新公司。可以看到,联想在人工智能领域的布局发挥了整个集团的联动效应。

        联想数据中心业务集团副总裁兼人工智能与高性能计算业务总经理Madhu Matta表示:“我们相信机器不会取代人类,而是能够改善和辅助我们的工作和生活,为此我们将此愿景称为增强智能。采用人工智能是一项复杂的工作,它需要优异的处理能力和一定程度的技术专业知识和人才,而此类资源往往是客户最缺乏的。联想已创建了一个端到端生态系统,能够在人工智能的每一步使用进程中为客户提供重要支持,助其深入探索人工智能战略,同时释放增强智能的强大力量。”

    从领跑TOP500看联想企业级的新动能
    联想数据中心业务集团副总裁兼人工智能与高性能计算业务总经理Madhu Matta

        在推广AI的过程中,联想会按照客户所在领域分析行业特点、环境特点、工作流程特点,之后将自身的软硬件产品进行定制化交付。期间,联想还会与行业专家合作,深入理解所在行业的架构、软件、开发等需求,帮助客户把AI部署到业务流程的每个环节。事实上,很多传统行业并没有意识到他们可以利用更前沿的技术改造生产流程,而这也是联想的机会所在。

        从SC 2017现场的感受来说,无论是医疗影像、图像识别,还是工业制造和娱乐应用,AI与HPC的结合正变得越来越紧密。例如,联想帮助可口可乐完善包装罐的制作流程,利用TensorFlow框架将100个样本导入ThinkSystem SD530,通过AI模拟数据自行训练,识别出颜色或形状有缺陷的产品,大幅节省了人力和时间成本。以往普通笔记本可能会花费数个小时进行这一工作,而SD530只会用两分钟。

    DCG成为联想新动能

        如果仔细观擦TOP500的榜单就会发现,尽管TOP500系统的综合性能达到845petaflops,不过与去年6月相比的近100petaflops增长幅度,仍然无法避免整体增速放缓的趋势。究其原因,无非是现有的超算发展陷入瓶颈,但换个角度想,谁要是能找到新的增长点,或许谁就能成为百亿美元市场的赢家。目前来看,这把取胜之匙很可能就是AI,而联想绝对算是先行者之一。在联想内部,HPC和AI同属一个事业部,原因之一就是高性能计算的部分技能在未来可以被用于处理AI大数据。

        从联想最近一个财季的财报来看,其营收增长至118亿美元,同比增长5%,税前利润达到3500万美元,由于税收抵免,净利润达到1.53亿美元。其中,数据中心业务对业绩提升的刺激作用显著。至此,“三波战略”已经初显成效。事实上,联想集团董事长兼CEO杨元庆始终信心满满:数据中心业务将是联想非常有潜力的业务,同时也是投资重点,有了合理规划和前瞻性布局,盈利只是迟早的事情。

        那么,联想数据中心业务的底气到底来自何处?可以归纳为三点:企业级的战略地位全球化的联动定制化的解决方案。首先,联想从集团层面专门划分出超大规模事业部、高性能人工智能事业部、软件定义事业部等BU,相关的销售团队和业务团队也会独立划分给数据中心业务集团。为此,联想还招募了数百名专职的数据中心业务销售,这种支持力度是前所未有的。

        其次,联想的全球化资源也是其他企业级厂商所不具备的,这种模式的双向互补为资源共享和部门协作奠定了基础。例如,LiCO由中国团队研发应用于本土市场,后来才逐渐被推广至全球。联想在全球有12个全球性的研发中心,均是针对不同产品和应用场景设置,分别面向PC+笔记本、数据中心、设备+云。具体到联想AI创新中心,三者之间有协调机制和统一的运维体系。此外,联想从PC时代积累下来的供应链优势可以整合集团的资源。作为全球排名前20的供应链公司,联想完全有能力让超大规模计算和HPC业务的反应速度媲美PC的水准。

        最后,定制化和产品创新一直是联想秉承的核心理念。Kirk表示,联想会以客户为中心实现产品设计架构的领先,而不是简单的生产或制造。例如第四代CPU到第五代CPU的迭代,预计在12月就能实现超过50%的Purly平台占比。针对本土客户,联想推出了“China for China”战略,成立专门的研发团队以满足各行业客户的定制化需求,通过PC的采购规模和流程优化有效降低成本,并且将交付时间大幅缩短六个月。

    从领跑TOP500看联想企业级的新动能
    联想ThinkSystem展台 可模拟图像实时渲染

    结语

        诚然,联想在转型之路上有过一些波折,但唯有坚持才能看到迎来新的突破。在企业级市场,联想一步一个脚印走的很扎实,不会盲目追求用户规模或者性能指标,而是静下心来倾听用户的需求。一方面,通过温水水冷、模块化设计等新设计思路开拓创新,另一方面充分发挥供应链和集团资源,将新技术第一时间交付给客户。正是因为有了这样的耐心和决心,联想的数据中心业务才会在企业级的竞争长河中处于领跑者的地位。就像Kirk所说的:“联想数据中心业务集团(DCG)在上一季度的业绩有了非常大的提升,我们未来会持续创新和改进,为大家带来更多惊喜。到2020年,希望联想会成为超算厂商中的第一名。”

    关注排行榜

    产品品牌

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询