不仅是CPU和GPU,企业级人工智能需要更多

2018-05-25 07:30:00 作者:佚名 出处 : 比特网

  在5月23日旧金山举行的英特尔人工智能开发者大会上,我们介绍了有关英特尔人工智能产品组合与英特尔Nervana™神经网络处理器的最新情况。这是令人兴奋的一周,英特尔人工智能开发者大会汇集了人工智能领域的顶尖人才。我们意识到,英特尔需要与整个行业进行协作,包括开发者、学术界、软件生态系统等等,来释放人工智能的全部潜力。因此,我很兴奋能够与众多业内人士同台。这包括与我们共同参与演示、研究和实践培训的开发者,也包括来自谷歌*、AWS*、微软*、Novartis*、C3 IoT*的诸多支持者。正是这种广泛的合作帮助我们一起赋能人工智能社区,为加快人工智能领域的技术创新和进步提供所需的硬件和软件支持。

  Naveen Rao发表演讲

  在加速向人工智能驱动的未来计算过渡之时,我们需要提供全面的企业级解决方案。这意味着我们的解决方案要提供最广泛的计算能力,并且能够支持从毫瓦级到千瓦级的多种架构。企业级的人工智能还意味着支持和扩展行业已经投资开发的工具、开放式框架和基础架构,以便更好地让研究人员在不同的人工智能工作负载中执行任务。例如人工智能开发者越来越倾向于直接针对开源框架进行编程,而不是针对具体的产品软件平台,这样有助于更快速、更高效的开发。我们在大会上发布的消息涉及所有这些领域,并公布了几家新增的合作伙伴,这都将帮助开发者和我们的客户更快速地从人工智能中受益。

  针对多样化的人工智能工作负载而扩展的英特尔人工智能产品组合

  英特尔近期的一项调查显示,在我们的美国企业客户中,50%以上都正在转向采用基于英特尔至强处理器的现有的解决方案来满足其对人工智能的初步需求。这其实肯定了英特尔的做法——通过提供包括英特尔至强处理器、英特尔Nervana和英特尔Movidius技术以及英特尔FPGAs在内的广泛的企业级产品,来满足人工智能工作负载的独特要求。

  我们今天讨论的一个重要内容是对英特尔至强可扩展处理器的优化。与前一代相比,这些优化大幅提升了训练和推理性能,有利于更多公司充分利用现有基础设施,在迈向人工智能初始阶段的过程中降低总体成本。最新的英特尔Nervana神经网络处理器(NNP)系列也有更新消息分享:英特尔Nervana神经网络处理器有着清晰的设计目标,即实现高计算利用率,以及通过芯片间互联支持真正的模型并行化。行业谈论了很多有关理论峰值性能或TOP/s数字的话题;但现实是,除非架构设计上内存子系统能够支撑这些计算单元的充分利用,否则很多计算是毫无意义的。此外,业内发表的很多性能数据采用了很大的方形矩阵,但这在真实的神经网络中通常是不存在的。

  英特尔致力于为神经网络开发一个平衡的架构,其中也包括在低延迟状态下实现芯片间高带宽。我们的神经网络处理器系列上进行的初步性能基准测试显示,利用率和互联方面都取得了极具竞争力的测试结果。具体细节包括:

  使用A(1536, 2048)和B(2048, 1536)矩阵大小的矩阵-矩阵乘法(GEMM)运算,在单芯片上实现了高于96.4%的计算利用率1。这意味着在单芯片上实现大约38 TOP/s的实际(非理论)性能。针对A(6144, 2048)和B(2048, 1536)矩阵大小,支持模型并行训练的多芯片分布式GEMM运算实现了近乎线性的扩展和96.2%的扩展效率,让多个神经网络处理器能够连接到一起,并打破其它架构面临的内存限制。

  在延迟低于790纳秒的情况下,我们测量到了达到89.4%理论带宽的单向芯片间传输效率3,并把它用于2.4Tb/s的高带宽、低延迟互联。

  这一切是在总功率低于210瓦的单芯片中实现的,而这只是英特尔Nervana神经网络处理器原型产品(Lake Crest)。该产品的主要目标是从我们的早期合作伙伴那里收集反馈。

  我们正在开发第一个商用神经网络处理器产品英特尔Nervana NNP-L1000(Spring Crest),计划在2019年发布。与第一代Lake Crest产品相比,我们预计英特尔Nervana NNP-L1000将实现3-4倍的训练性能。英特尔Nervana NNP-L1000还将支持bfloat16,这是业内广泛采用的针对神经网络的一种数值型数据格式。未来,英特尔将在人工智能产品线上扩大对bfloat16的支持,包括英特尔至强处理器和英特尔FPGA。这是整个全面战略中的一部分,旨在把领先的人工智能训练能力引入到我们的芯片产品组合中。

  面向真实世界的人工智能

  我们产品的广度让各种规模的机构能够轻松地通过英特尔来开启自己的人工智能之旅。例如,英特尔正在与Novartis合作,使用深度神经网络来加速高内涵筛选——这是早期药品研发的关键元素。双方的合作把训练图片分析模型的时间从11个小时缩短到了31分钟——改善了20多倍4。为了让客户更快速地开发人工智能和物联网应用,英特尔和C3 IoT宣布针对优化的AI硬软件解决方案进行合作——一个基于Intel AI技术的C3 IoT AI应用。此外,我们还正在把TensorFlow*、MXNet*、Paddle Paddle*、CNTK*和ONNX*等深度学习框架集成在nGraph之上,后者是一个框架中立的深度神经网络(DNN)模型编译器。我们已经宣布,英特尔人工智能实验室开源了面向Python*的自然语言处理库,帮助研究人员开始自己的自然语言处理算法工作。

  计算的未来依赖于我们联合提供企业级解决方案的能力,通过这些解决方案企业可以充分发挥人工智能的潜力。我们迫切地希望可以与社区以及客户一起开发和部署这项变革性技术,并期待在人工智能开发者大会上拥有更精彩的体验。

本文作者:Naveen Rao 英特尔公司全球副总裁兼人工智能产品事业部总经理

* 本文为ChinaByte比特网原创内容,版权所有,转载请注明出处和原文链接,未经授权请勿用于商业用途。

最近更新
科普

科普图集
从《中国互联网+指数报告(2018)》看数字经济

从《中国互联网+指数报告(2018)》看数字经济>>详情

“互联网+”的这些新变化,你知道吗?

“互联网+”的这些新变化,你知道吗?>>详情

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。