热点:

    全栈AI赋能数字化 看微软Azure的智慧之路

      [  中关村在线 原创  ]   作者:徐鹏

        “预测未来的最好办法就是发明它。”60年前的某个夏天,麦卡锡、明斯基等年轻的科学家们举办了一次聚会,共同研究用机器模拟智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出。如今,AI已经成为继PC、Web之后的第三代系统平台,深植于语音识别、图像处理器、计算机视觉、机器人等多个领域,而这一系列成绩的背后是海量数据的积累与学习,在没有云的时代,是无法想象的。

        打开手机中的Cortana或者Siri,这就是AI的产物。要知道,在几十年前,这种超前的技术是不受认可的,教授相关课程的学校也是寥寥无几。分析让大量的数据有了价值,机器开始懂得用户想要什么,可以预测未来的天气和球赛的比分,这种人工智能与场景的结合,要实现的就是改变生活方式和解放生产力。

        很多过去只有人能做的事情,现在更多的情况下能够通过机器实现,典型的例子包括语音助手、无人驾驶汽车。更重要的是,当硬件性能逐渐提升、计算资源越来越强大时,成本却越来越低廉。可以说,传统生产力和沟通方式正在一个全新的平台上迸发活力,这个平台做的事情不仅仅是管理信息,还包括从信息中学习,与物理世界交互。

        当然,要想在人工智能时代分一杯羹,绝非易事。AI的基础是大数据,这些资源通常掌握在巨头手中,这也是为什么你会看到,这个领域的头条总是被微软、谷歌、IBM、苹果、亚马逊、Facebook这些公司抢去。微软CEO萨提亚·纳德拉认为,人工智能是技术上的终极突破,“过去五年间,深度神经网络技术异军突起,它让AI有了人类的感知能力,在语音和图像识别上突飞猛进。”

        众所周知,微软对人工智能的探索由来已久。早在26年前,微软联合创始人比尔·盖茨在创建微软研究院时,就提出了创造能看、能听、能交谈,并且能够理解人类的计算机的愿景。时至今日,微软已经实现了几个前几年还看似遥不可及的创新成果。2016年,微软成为第一家语音识别能力与人类相媲美的公司,使得计算机能够达到和人类一样的速记水平。上个月,微软研究员开发的人工智能机器阅读系统,率先超越了人类的分数......这一系列的技术突破也推动了公司业绩的攀升。

        截至2017年12月31日的2018财年第二季度财报显示,微软第二财季营收289亿美元,与去年同期相比增长12%。微软企业云的各部分业务都保持了高速增长,其中企业级Office 365服务营收同比增长41%,Dynamics 365业务营收增长67%,Azure业务实现98%增长,服务器产品和云服务收入增长18%。用纳德拉的话说,微软在云平台上对物联网、大数据和人工智能方面的投入,已成为推动持续增长的核心优势。

        为了实现“普及人工智能全民化”的承诺,微软将其在人工智能领域20多年的研究成果汇聚成Azure云端的认知服务,以API的形式开放给开发者,开发者只需要几行代码,就能借助微软认知服务,开发出自己的跨平台人工智能应用。目前,微软认知服务在全球提供了覆盖视觉、语言、语音、搜索、知识五个主要应用场景的30余项人工智能服务,提供30多个智能API接口,是唯一允许用户自行定制的人工智能服务。

    透过AI重新认知世界

        整体来看,微软Azure智能云的AI平台可以针对不同场景灵活选择各类AI服务,借助企业级AI基础架构运行AI工作负载,为开发者和数据科学家提供现代化的AI工具,帮助他们快速简单地创建AI解决方案。其中,AI服务包括三类互为补充的服务:已经训练完成可直接调用的认知服务、可提供对话式交流的Bot框架,以及可按需开发和训练的Azure机器学习服务。

        借助认知服务,开发者只需在自己的应用中嵌入几行代码,即可调用认知服务API获得对应的能力,并将这样的能力跨设备、跨平台应用到Windows、iOS、Android上。由世纪互联运营的中国区Azure平台暂时仅提供有人脸识别API、情绪识别API和计算机视觉API,未来的能力将逐渐像国际版Azure一样丰富。以情感识别为例,其可以通过人脸API针对图像中的每张人脸返回情感集的检测置信度以及人脸的范围框。检测到的情感包括快乐、悲伤、意外、愤怒、恐惧、蔑视、厌恶或中性,这些情感通过相同的基本面部表情在各种文化环境中全球传递,然后由情感API识别。

        如果是视频情感API,会针对帧中人脸的情感提供两种类型的聚合结果。首先,API会计算视频中每张人脸的情感评分,将一段时间内的结果平滑化,以提高准确性。它返回两种类型的聚合:windowMeanScores 提供在帧中检测到的所有人脸的每种情感的平均评分。应该将检测到的情感解释为具有最高评分的情感,因为规范化后的评分累加为1。用户可以根据需要,在其应用程序中设置较高的置信度阈值。

        这一过程中,windowFaceDistribution提供作为主导情感的每种情感所在人脸的分布,每张人脸的主导情感根据该人脸的最高分情感确定。由于情感会随着时间的变化而变得平缓,因此如果曾经生成了一个视觉对象用于将结果层叠在原始视频的顶层,则要从提供的时间戳中减去250毫秒。

        再来看Azure机器学习,这可以说是集成式的端到端数据科学和高级分析解决方案,能够让数据科学家以云的规模准备数据、开发试验和部署模型。如果想预先部署,需要准备的主要组件包括Azure Machine Learning Workbench、Azure机器学习试验服务、Azure机器学习模型管理服务、用于Apache Spark的Microsoft机器学习库,以及用于AI的Visual Studio Code工具。Azure机器学习完全支持开源技术,包括微软自由的开源技术,可以在Docker容器和Spark群集等托管环境中执行试验。

        创建Azure机器学习服务帐户前,要使用Azure订阅的凭据登录到Azure门户进行资源创建,在搜索栏中输入“机器学习”,选择名为“机器学习试验”的搜索结果。之后,在“ML试验”窗格中配置机器学习试验帐户。这里有一些注意事项:1、Location设置时,选择最靠近用户和数据资源的位置;2、存储账户必须填写,用于保存项目内容和运行历史记录数据;3、模型管理帐户,建议在创建试验帐户的同时创建模型管理帐户,可选操作;4、模型管理定价层,若要节省成本,可选“DEVTEST” (如果可在订阅中使用,可用性受限), 否则选择S1定价层来节省成本。 

    全栈AI赋能数字化 看微软Azure的智慧之路
    配置账户

        上述步骤完成后,需要等待一段时间创建,单击Azure门户工具栏上的钟形图标即可查看部署过程的状态。进入到Azure Machine Learning Workbench安装环节(大约需要30分钟),这里要提示将安装程序整个下载到磁盘上,在磁盘中运行安装程序,不要直接从浏览器的下载小组件运行安装程序。如果是Windows平台,安装路径为C:\Users<user>\AppData\Local\AmlWorkbench;如果是macOS平台,安装路径为/Applications/Azure ML Workbench.app。安装程序会下载并安装所有必需依赖项,例如Python、Miniconda 和其他相关库。 此安装还包括Azure跨平台命令行工具,即 Azure CLI。

        启动Workbench,其会使用其在Azure订阅中找到的第一个试验帐户。Workbench使用找到的第一个试验帐户,并显示与该帐户关联的所有工作区和项目。在Azure机器学习中,项目是解决问题时所做的所有工作的逻辑容器,其映射到本地磁盘上的单个文件夹,可以向其中添加任何文件或子文件夹。如果选择“Iris flower data set”为模板创建新的 Workbench 项目,在新建模板中填写相应说明,创建完成后可以看到项目主页、数据源、Notebook 和源代码文件。

    全栈AI赋能数字化 看微软Azure的智慧之路
    点击新项目

    全栈AI赋能数字化 看微软Azure的智慧之路
    创建新项目模板

        完成配置后,可以在本地计算机上运行 iris_sklearn.py 脚本,此脚本使用常用Python scikit-learn库中的逻辑回归算法来生成模型。第一步,在“项目仪表板”页顶部的命令栏中,选择“local”作为执行目标,选择“iris_sklearn.py”作为要运行的脚本;第二步,在“参数”文本框中输入 0.01,此数字在脚本代码中用于设置正则化率;第三步,选择“运行”,开始在计算机上执行脚本,作业会显示在右侧的“作业”面板中;第四步,使用 0.001 到 10 范围内的不同参数值重复执行步骤2-3多次;第五步,检查运行历史记录,先选择“运行”视图,再选择“运行”列表中的“iris_sklearn.py”,找到脚本的运行历史记录;第六步,使用齿轮或筛选器图标,通过对配置执行排序、筛选和调整操作来自定义视图;最后,在“作业”窗格中选择已完成的运行,以便查看该特定执行的详细视图。

        当Azure机器学习命令行界面安装后,可通过 CLI 界面来访问Azure机器学习服务并与之交互,使用 az 命令执行端到端数据科学工作流所需的所有任务。如果不打算继续使用此应用,需要删除本快速入门中创建的所有资源,以免产生任何费用。

    全栈AI赋能数字化 看微软Azure的智慧之路
    删除资源

        至此,Azure机器学习帐户的创建,以及Azure Machine Learning Workbench的安装均已完成,在该应用程序中,已创建项目、运行脚本并浏览脚本的运行历史记录。

        总的来说,Azure机器学习是一种云端的预测分析服务,可以帮助我们快速创建预测模型,并将其部署为分析解决方案。机器学习服务完全通过Azure公有云提供,可自动配置所需计算资源和内存,无需配置和安装。

        除了机器学习,微软的AI服务还包括Bot框架,能够帮助用户创建出通过自然语言对话方式与用户交互的应用,例如Cortana这样的智能语音助理。在Bot框架和Azure Bot服务的帮助下,通过一个集成式环境直接在浏览器内开发、测试、部署、管理自己的聊天机器人,并将其与各种IM渠道进行集成。

    让AI惠及每一个人

        不仅是上层服务,微软还提供了高效、集成、便捷的底层架构和开发工具,为企业接入AI降低了门槛,让每个人都能化身AI工程师。拿AI基础架构来说,其为用户的AI应用提供了必要的计算能力和数据存储分析能力。AI计算方面,可以利用Spark on HDInsight在云中通过Apache Spark实现任务关键型部署;利用数据科学虚拟机,通过包含热门工具的数据科学环境进行数据探索、建模和部署活动;利用Batch AI训练服务获得无限制的弹性横向扩展深度学习,并通过GPU加速大规模高度并行AI开发工作;此外,还能借助Azure容器服务使用Kubernetes、DC/OS或DockerSwarm来缩放和协调容器。

    全栈AI赋能数字化 看微软Azure的智慧之路
    物联网应用架构,接收实时流数据

        简单讲,AzureHDInsight是Hortonworks Data Platform提供的Hadoop组件的云发行版。可以通过Azure HDInsight轻松、快速且经济有效地处理大量数据,支持使用Hadoop、Spark、Hive、LLAP、Kafka、Storm、R等最常用的开源框架来启用各种方案,例如提取、转换和加载、数据仓库、机器学习以及物联网。扩展性方面,可借助脚本操作来安装组件(Hue、Presto 等),从而扩展HDInsight群集,例如添加边缘节点或集成其他大数据认证应用程序。

        使用时,AzureHDInsight 可以在各种用例中进行大数据处理。大数据可以是历史数据(已收集和存储的数据),也可以是实时数据(直接从源流式传输的数据),主要处理类别包括批处理、物联网、数据科学、数据仓库、混合环境。

    全栈AI赋能数字化 看微软Azure的智慧之路
    数据科学应用架构,从数据中提取关键程序

    全栈AI赋能数字化 看微软Azure的智慧之路
    数据仓库应用架构,对数据执行PB规模交互式查询或连接至BI工具

        数据科学虚拟机(DSVM)是一种强大的数据科学开发环境,支持Windows和Linux操作系统,针对机器学习和深度学习任务进行了优化,预置常用的数据科学工具,适用于数据探索和建模等任务。DSVM预装并配置了多个常用于数据分析和机器学习的工具,如Azure MachineLearning Workbench、Microsoft Machine Learning Server开发人员版、Power BI Desktop、SQL Server 2017 DeveloperEdition等。DSVM提供可在Azure上预配的现成映像,并且支持处理各种语言版本的任务,包括R、Python、SQL和C#。

    全栈AI赋能数字化 看微软Azure的智慧之路
    创建数据科研虚拟机

        以预配Windows平台DSVM为例,现先在Azure门户中导航到虚拟机列表,选择底部的“创建”按钮进入向导,按照步骤填写信息。此过程的注意事项:1、如果是GPU(NC系列),选择“HDD”作为磁盘类型;2、选择适合的数据中心,参考标准是应拥有大部分数据,或最接近实际位置以实现最快的网络访问;3、选择能满足功能需求和成本约束的服务器类型;4、如果用Azure管理VM的磁盘,选择“托管”,否则需要指定新的或现有的存储帐户。整个过程中,除了计算“大小”步骤中选择的服务器大小所产生的费用,VM没有任何其他费用。预配时间约为10-20分钟。

        创建VM后,可以使用在前面的基本信息部分中配置的管理员帐户凭据从远程桌面登录VM,并且能使用其上安装并配置的工具。值得一提的是,为了帮助用户创建仪表板和优雅的可视化效果,VM上还安装了Power BI Desktop,可以从不同的源提取数据,创建仪表板和报告并将其发布到云中。

        数据AI方面,可以借助Data Lake Store服务以PB级别运行数据转换和AI,通过Azure SQL数据库为R、Python和本机机器学习提供业界领先的SQL数据库。同时,Azure Cosmos DB服务将AI与全球分布的多模型数据库服务集成。由此,用户的数据平台将直接获得强大的AI能力。

        针对AI相关的代码编写和管理,微软的AI平台还提供了一系列工具,帮助开发者使用惯用的深度学习框架驾驭大规模数据集,从中获得智能。在开发和管理工具方面,可以通过Azure Machine Learning Studio以简单的拖拽操作轻松生成、部署和管理预测分析解决方案;通过Azure Machine Learning Workbench驱动由可视化AI提供支持的数据整理、试验和生命周期管理;通过Visual Studio Code Tools for AI在Windows和Mac上构建、调试、测试并部署AI;通过AzureNotebooks在用于数据科学和分析的集中库中组织数据集和Jupyter Notebook。

        可以看到,从上层服务到底层基础架构,再到配套工具,微软AI平台以Azure智能云为基础,为我们提供了一个完整的AI应用开发、运行和交付环境。

    企业创新和出海的好帮手

        随着微软智能服务的陆续完善和成熟,已经有越来越多的客户开始借助微软AI平台和Azure公有云服务打造创新业务,例如互动娱乐供应商:游族网络股份有限公司。目前,游族网络已携手海内外1000多个合作伙伴,成功发行超过30款产品,在全球累积超过8亿用户。

        当游族网络海外游戏产品及覆盖地域的不断增多,玩家对于沟通和交流的需求也日益增长。为了满足不同语种的海外玩家互相沟通的需求,经过技术水平、服务可靠性、价格、本地支持等多种评估,游族网络选择使用微软认知服务里的翻译工具文本API (Translator Text API)和Microsoft Azure进行游戏实时翻译服务的开发,提供游戏内实时语言翻译服务。

        翻译需求发起时,会从用户端向负载均衡器发出信号,进而通过缓存服务→Web服务器 →Microsoft Translate→Web服务器→缓存服务器,最终返回到用户端。如果缓存服务器有数据,会直接将数据返回给用户。在这里提一下缓存服务器,游族网络使用了应用反向代理模式,该模式主要针对Web服务器进行加速。在该模式中,缓存服务器被置于Web应用服务器的前面,当用户访问Web应用服务器的时候,首先经过缓存服务器,并将用户的请求和应用服务器应答的内容写入缓存服务器中,从而为后续用户的访问提供更快的响应。

    全栈AI赋能数字化 看微软Azure的智慧之路
    翻译服务逻辑架构图

        2016年下半年,游族网络正式上线了游戏即时翻译服务,面向海外市场接入了多款系列手游和页游平台,实现了对欧美、东南亚等多个地区的覆盖,提供超过20种语言的实时翻译,月均翻译超过70亿个字符,总覆盖玩家超过2亿。这套翻译服务满足了不同语种玩家的即时沟通需求,节省了人力物力,降低了运维技术难度。

    全栈AI赋能数字化 看微软Azure的智慧之路
    业务运行流程图

        此外,游族网络还将利用微软认知服务中的翻译服务实现游戏UI的自动化翻译,以智能云替代传统的人工游戏界面本地化工作,加快游戏推向市场的速度。在这套系统的帮助下,使用不同语言的玩家可以更紧密连接在一起,提升了用户粘性和活跃度,推动游戏生态健康发展,助力游族网络深耕海外游戏市场。

    结语

        如今,微软在人工智能领域的投入已经超过25年,利用AI为工业、教育、环境、医疗等各个领域带来了应用创新。更重要的是,在深度学习、神经网络等一系列技术深耕的背后,微软始终坚守着社会责任感,致力于帮助弱势群体、促进全球的可持续发展。例如,通过免费应用“Seeing AI”帮助全球2.85亿视障人群感受周围的世界。就像纳德拉所说的:“如果我们希望利用技术来满足人类的需要,就必须培养更深入地理解和尊重彼此的价值观、文化、情感和驱动力的能力,来发挥引导作用。同理心在机器中难以复制,在人工智能的世界中,它将是无价之宝。”

    本文属于原创文章,如若转载,请注明来源:全栈AI赋能数字化 看微软Azure的智慧之路http://cloud.zol.com.cn/682/6822990.html

    cloud.zol.com.cn true http://cloud.zol.com.cn/682/6822990.html report 13182 “预测未来的最好办法就是发明它。”60年前的某个夏天,麦卡锡、明斯基等年轻的科学家们举办了一次聚会,共同研究用机器模拟智能的问题,也是在那时,“人工智能(AI)”的理念正式被提出。如今,AI已经成为继PC、Web之后的第三代系统平台,深植于语音识别、图像处理器、...
    • 猜你喜欢
    • 最新
    • 相关
    推荐经销商
    投诉欺诈商家: 400-688-1999
    • 北京
    • 上海
    周关注排行榜
    • 产品
    • 品牌
    推荐问答
    提问
    0

    最新科技资讯
    下载ZOL APP