论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

全新的计算世界:AMD能效白皮书

发布时间:2014-06-20 17:44:00 来源:比特网 作者:zhanggl
关键字:amd 白皮书 能效

  摘要

  AMD产品在稳步降低功耗和提升性能方面始终有着强劲表现,而且该公司还在寻求通过宏大的计划进一步提升这些优势。AMD在服务器和独立显卡等市场都在推动节能发展,但是本白皮书将主要关注笔记本平板电脑芯片这两大移动计算领域的节能技术。通常衡量节能的常用标准是耗费单位能源所能完成的工作;比如,一台能效更加出色的笔记本电脑可以让用户在功耗和机身温度更低的情况下完成同样的任务。

  能源之星[1]定义了一种方法,用来测量移动计算一般功耗的合理近似值。有些出人意料的是,这种方法主要测量“短时待机”功耗。一般情况下,用户会在打开文档或网站页面后花费一定时间查看结果。就现代使用电脑的方式而言,这些待机时间可能是敲击键盘时的短暂停顿或视频不同画面切换时的一点空隙,而处理器则会在此时进入低功耗状态。因此,AMD 将其移动设备芯片的一般使用能效定义为用计算性能除以一般功耗。例如,在比较两台性能相似的笔记本电脑时,用户更喜欢电池续航时间长的机型— —同样,如果两台笔记本电脑提供相同的电池续航时间,用户更喜欢性能高和响应快的机型。这两种情况都在一般使用能效衡量标准中得到体现。

  按照这一衡量标准,AMD公司将其移动处理器产品系列在过去六年的能效数据列成表格,结果显示这一数据提高了10倍[2]。这一成绩听起来十分辉煌,只可惜我们已经习惯于半导体创新的快速步伐— —按照库米定律[3],我们理应期待不低于这个量级的能效提升。但在过去 10 年里,原始效率的改善明显减速,许多专家都认为摩尔定律正在放缓。这也是 AMD 加快提升其移动计算产品一般使用能效的计划如此令人印象深刻的原因。公司把未来六年一般使用能效提升的目标定为25倍2,远高于过去六年10倍的提升速度。

  为了达成这一远大目标,除了采用更先进的芯片制程技术,AMD还将充分利用在架构、设计、软件以及硅加工工艺方面的各项资源。根据现有产品,公司特别指定了三个主要资源:

  · 智能实时功耗管理的改进。这些改进可以降低待机功耗,并充分利用迅速完成工作后的“快速待机”更快地回到低功耗状态。这也是AMD的能效实现10倍提升的主要原因,而公司还在不断设法改进这一技术。

  · 异构计算能力。异构系统架构(HSA)可以提高AMD APU对常见工作负载以及新兴的视觉类和互动类工作负载(如自然用户界面图形及语音识别等)的处理性能(使用PCMark 8 v2.0等行业衡量标准测量)。AMD是异构系统架构基金会的创始成员之一,该组织致力于推广异构计算标准。凭借在GPU设计方面的领先地位,AMD有实力定期推出处理器的升级。

  · 节能技术创新。AMD旨在通过高级电源门控、低电压工作以及系统组件高度集成等技术来推动APU产品知识产权能效的提升。这些技术可以帮助公司实现在未来六年能效提升25倍的目标。从AMD的路线图可以看到它还有许多创新技术正处于研发当中,未来将有更智能的节能技术陆续推出。

  如果把之前六年(10倍)和未来六年(25倍)的提升结合起来,AMD移动计算芯片的一般使用能效的提升将达到惊人的250倍(之前的10倍提升乘以未来预计25倍的提升)——即使对那些熟悉半导体行业巨大进步的市场资深人士来说,这也是一项惊人的创举。

  AMD节能创新

  AMD在处理器创新上有着悠久的历史。凭借自己独树一帜的创造力,公司对过去十年计算行业的巨变做出了积极应对。

  AMD的声望主要来自PC和服务器处理器,但它同时也拥有最顶尖的显卡人才。正是凭借自身世界一流的GPU设计,AMD才得以将CPU和GPU整合在同一个芯片上,从而实现推动微处理器业务变革的宏伟蓝图——这种方式被称作 “异构计算”。

  AMD的创新历史包括率先推出1GHz主频的PC处理器、首款64位PC处理器和首款x86服务器处理器以及首款多核x86处理器。公司还参与了第一台采用GPU支持的超级计算机的研发。AMD的产品拥有业内领先的技术与性能,被三大游主机厂商的最新产品同时采用,。如今,AMD不仅在性能上处于领先地位,还可以通过异构计算整合了这两种处理单元(CPU和GPU),带来强大的每瓦性能。

  为了解决功耗对系统性能提升的限制,AMD研发出一种可以实现并行任务在CPU和GPU之间无缝切换的异构计算。这种架构在改善能效的同时使性能得到提升,并且保留了可编程的特性。

  为了实现更加出色的能效, AMD通过合作获得了64位ARM架构的使用权,并将在下一代高密度服务器投入使用。目前,公司经验丰富的设计团队正在围绕这一架构打造专门针对独特性能和功率进行优化的核心。此外,他们还在设计可以在低功耗服务器应用环境工作的APU,这些新产品将具备相似的能效和异构系统架构(HSA)计算性能。

  我们相信更低的待机功耗、更智能的功耗管理再加上异构计算(HSA)对性能的提升以及制程技术的改进,将在很大程度上帮助AMD实现从2014年到2020年间将一般使用能效提升25倍的目标 。

  设计高能效处理器

  解决节能问题的方法有很多,但是还没有一个能够实现更高能效水平的“杀手锏”。过去,半导体制程的进步曾经是提高能效的最大动因,因为更小的晶体管(一个“缩小体”)转换状态所使用的能量更少,在更低的电压下也能工作。制程的缩小通常会对电子设备的两个重要因素产生影响:电源电压以及晶体管转换所需的电流(因为电流容量降低)。电流也是来自晶体管转换的速度,并且和主频成正比。因此,更高的主频会导致功耗变高。更低的主频需要更长的处理时间,从长期来看系统功耗更高,因此更低的功耗和主频本身并不足以实现节能。

  图1为处理器功耗简化图示。它阐明了两个主要组成部分:待机功耗和动态功耗。待机功耗是由芯片上数百万(或数十亿)个晶体管电流泄漏造成的(晶体管做为开关控制并不完美——它们在两种状态下都会有少量漏电)。动态功耗与主频成正比——频率越快,功耗就越大。过去,设计师往往不关注漏电,而是专注于动态功耗管理。随着超快功耗管理的推出,现在处理器更多时候是处于待机状态。

   图1. 处理器功耗与频率对比简化图

  由于待机状态越来越多,现在待机状态下的功耗已经成为移动计算一般使用功耗的主要指标,因此降低待机功耗对功耗管理而言愈发重要。待机功耗也会随着处理器电压加大变高(图中虚线右侧的区域),导致最高功耗进一步增加。使用新的半导体生产技术(通常是新的晶体管结构或材料)可以解决一部分漏电问题,但是电路设计的作用越来越重要。

  降低功耗虽然是一个重要目标,但是半导体行业也会凭借更强的性能来提高生产力。制程技术改进(减小晶体管结构尺寸)带来的功耗降低可以让芯片设计人员在尺寸和功耗相似的情况下在芯片中置入更多晶体管。

  整个行业对高性能的追求导致芯片尺寸不断变大,晶体管数量快速增长,这种增长的速度已经超过了采用新的生产制程所减少的功耗。同样,虽然新出的晶体管要比之前的高效,但是晶体管的总数在过去十年扩张得更快,这也导致CPU功耗越来越高。

  随后,行业格局发生了变化:笔记本开始取代台式机,移动的重要性超过了单纯的性能。平板电脑和智能手机的一些应用代替了笔记本 。半导体厂商如不采取更多办法降低芯片有效功耗,就无法再增加主频和晶体管数量,制程也不再是降低功耗的主要手段;整个行业亟待创新的电路和设计出现。

  此外,人们熟知的摩尔定律曾经声称半导体制程会不断进步,但是现在这一定律已经开始遇到瓶颈。新的制程生产成本变得更加高昂,核心工作电压下降幅度开始变得有限。与十年前不同,单纯地改进制程已经无法有效降低功耗。而新的高效设计方法和更为智能的功耗管理,再加上软件对工作负载更为合理的分配,不仅可以让能效变得越来越好,还能针对高级应用不断提升性能。

  AMD应对功耗挑战

  AMD过去十年一直在努力通过设计来降低功耗,现在它打算通过APU、GPU和高密度服务器实现一次重要的超越。通过测量,公司发现笔记本处理器的功耗在过去六年降低了将近60%(一般使用情况下),而计算性能的提升则超过4倍[4]。也就是说,按照一般使用功耗的每瓦最高性能来测量,从2008到2014年能效水平提高了10倍。

  由于大多数系统的处理性能在使用时都不会一直处于极限,因此将处理器的功耗转到最低状态就很重要。但是设备必须保留充足的性能空间来满足高峰时期的需求。AMD正在通过多项基本系统创新来实现这一目标。

  公司已经研发出一种智能动态功耗管理技术,并将其用于所有的APU产品。近期推出的APU还在一个芯片上集成了多个系统组件,并取消了芯片间的接口,用更高级的制程工艺来生产所有组件,从而成功降低了功耗。当然,AMD也采用了制程缩放和优化芯片设计原理来降低功耗。

  在笔记本处理器方面,AMD将GPU、内存控制器、I/O控制器及外设总线等系统组件全部集成在一个芯片上[5]。把CPU和GPU集成在一个芯片上有很多好处;比如,这样可以实现精细功耗管理技术对CPU和GPU的同时监控。这一技术可以平衡CPU和GPU的功耗优化,将散热系统分配给最需要的处理器。另外,把GPU和CPU整合在一个芯片上还可以减少所需的内存接口,从而降低功耗。

  AMD智能功耗管理通过专用片上控制器来追踪功耗、温度和各主要组件的活动,从而使APU能效进一步得到提升。功耗微控制器就像是“APU交响乐”的指挥,在正确的时间指挥处理器处理正确的任务。它可以对热量变化快速作出反应,让控制器迅速将功耗分配给CPU的特定部位来实现性能和效率的最大化。它还可以判断处理器什么时候最不活跃,然后将它们的运转状态降到最低或者将其完全关闭。

  如图2所示,最新的AMD智能功耗管理器包含一个32位控制器。它通过计算系统活动和测量热功耗来决定APU的电压和频率。当系统活动较少时,它会降低电压和频率。当活动增加时,它会增加电压和频率,直到处理器达到发热限制。

  Energy Efficiency white paper slides v2 图 2. AMD智能功耗管理器

  如图3所示,通常情况下,当处理器以最快的时间完成任务,并进入最深的睡眠状态时,它所实现的能效最大。大多数面向消费者的任务,比如网页浏览和文档编辑可以从“快速待机”行为中获益。GPU与CPU协作可以让APU更快完成任务,然后把功率降下来,从而减少总能耗(能耗是功率乘以时间)。这种功率状态转换需要快速进行,这样处理器才能尽快关闭,在用户敲击键盘和播放视频的间隙进入一种待机状态。

   Faster processing finishes earlier à lower power

  图 3. 未加速处理与GPU加速处理对比

  高能效计算的未来属于异构

  AMD正在设计可以兼容异构系统架构(HSA)的尖端APU产品。异构系统架构可以帮助软件使用GPU和其他处理组件的功率和性能。当高度并行代码在GPU而不是CPU上运行时,APU可以使用其GPU核心的能效和大规模并行架构来更快完成对任务的处理。HSA架构可以把工作负载分配给最合适的芯片资源,比如专门针对特定算法设计的加速器。HSA可以减少固定工作负载的处理周期和功耗,从而让运算需求较大的高级应用在移动设备有限的功率下运行。高级移动应用包括声音识别、手势控制、脸部识别以及图片索引等下一代用户界面,用GPU代替CPU来处理这些应用可以使性能获得极大的提升。

  图4显示异构系统架构能通过挖掘更多的每秒浮点运算(FLOPS)来提升潜在性能。

   图 4. 一般35瓦移动处理器的GPU运算趋势

  PC处理器的性能随着时间的推移不断增强,但是增速逐渐放缓。另一方面,随着设计人员将更多的芯片空间留给显卡来支持高达4K的显示分辨率,GPU性能开始飞速提升。凭借异构系统架构,AMD可以很好地挖掘GPU的性能提升。如图4所示,PC应用和衡量基准已经可以检测出使用GPU处理通用任务带来的提升。OpenCL是首批支持GPU并行运算的行业标准编程语言之一,可以让C语言程序充分挖掘语言扩展,从而大幅提升编码中运算密集部分的性能。如图5所描述,当OpenCL 1.x (支持完整HSA性能的OpenCL 2.x的先行版本)开启加速时,PCMark 8 v2.0衡量基准显示性能提升多达25%。

   图5. PCMark8 v2.0在当前平台上通过GPU卸载实现加速

  如图4所示,异构系统架构可以有效利用GPU性能的快速提升,近期GPU性能提升的速度大大超过了CPU。未来的处理器要想同时提升性能和能效,GPU将继续扮演重要的角色。每一颗GPU都具有多个 “流”核心(AMD称之为“流处理器”),每个核心可以处理整数及浮点运算,并且占用空间及功耗都比一般的CPU核心更小。由于流核心面积很小,一个芯片可以把几十甚至几百个流核心与几个通用CPU核心整合在一起。这样一来,GPU针对那些可以利用处理核心性能的工作负载的计算性能就得到大幅的提升。之前提到的高级应用可以使用GPU固有的并行计算在少量功耗的情况下实现性能的大幅提升。

  图6显示从2008年AMD “Puma” CPU处理器开始到2020年APU预测一般使用功耗降低[6]的情况。灰色虚线表示到2015年的功耗趋势;从之后到2020年下降幅度将降低,因为功耗已逐渐接近0瓦。虽然2015年以后一般使用功耗下降开始趋缓,但是我们预计异构计算将飞速发展,从而推动整体性能与GPU性能等比提升。

   图 6. AMD APU能效与计算趋势

  待机功耗的下降使得一般使用功耗从2008年“Puma” CPU的接近4瓦降至2014年“Kaveri” APU的1.6瓦,基本功耗提升为2.5倍(两款产品都是用于笔记本电脑35瓦热功耗设计)。处理器性能的提升主要来自更多的CPU核心,更高的主频以及GPU协同计算,其中“Kaveri”的计算性能比“Puma”提升多达4.5倍。根据一般功耗下的最大性能来看,“Kaveri”的一般使用能效比“Puma”提升超过10倍。2015年AMD将对“Kaveri”做出一系列重大改进,再一次实现功耗的大幅下降。随着功耗逐渐接近0瓦以及平台组件功耗开始成为控制功耗的主因,未来待机功耗下降速度势必会放缓。通过对AMD产品路线图的分析,我们预计在自2008年到2020年的12年内,AMD的一般使用功耗会有一个巨大的降幅,达到16倍。

  基于预计的GPU性能提升和支持异构计算的应用数量的增加(图6中的蓝色实线),我们预测AMD将在2020年达到一个均衡点。届时GPU和CPU将各自提供大约一半的最大性能。在CPU和GPU同步升级的情况下,据保守估计,2020年推出的APU计算性能将比2014年的“Kaveri”提升4倍4。由于GPU越来越大以及更多并行计算应用的出现,预计性能还会进一步提升。保守估计得出的4倍计算性能提升,再加上一般使用功耗至少降低6倍,使得AMD 的最大性能与待机功耗比将在2014年到2020年间提高25倍。这样的提升可谓惊人,功耗和性能都堪称最佳:极低的待机功耗轻松实现节能,极高的最大性能充分满足未来高级应用的需求。

  全新的计算世界:节能无处不在

  云计算、移动计算和大数据分析的崛起推动了在功耗、空间和成本有限的条件下对海量信息处理的需求。呈现爆炸式增长的数据大多杂乱无序,需要强大的计算性能从中提取出有用的情报。可是,面对数量持续增长的云数据,数据中心机房扩容和增大电力支持的速度往往滞后。这一趋势迫使云服务器不得不降低高密度机架式服务器的功耗。

  即使抛开大数据和云服务不谈,计算也正在变得无处不在。我们身处的这个“环绕计算”时代对功耗同样极度敏感,这一部分是因为物联网(IoT)设备和24小时开机的计算设备十分耗电。要更好地支持“环绕计算”时代,处理器必须足够智能,能将合适的处理组件(比如CPU或GPU)用于正确的任务。另外,可感知环境的智能设备今后将大行其道,这种设备与全球信息基础设施相连,并通过自然界面和用户进行通信。所有这些技术都需要高能效的复杂处理。

  高能效处理器的目标是用更低的功耗提供更高的性能。就移动设备而言,这意味着更长的电池续航时间和更轻的重量。对笔记本来说,散热好和噪音小则是关键。高能效的服务器处理器则需要设法降低整体功耗和数据中心的成本——包括服务器以及散热系统。更高的能效可以降低电子设备的总体购置成本,并且可以减少对环境的影响。

  由于大型数据中心的开支和能源消耗给环境带来的影响,这些服务、情报和数据的处理必然要消耗和现在同样(或者更少)的能源。虽然现在处理器的能效更高了,但是数据中心的功耗和碳排放量却持续攀升。据估计,目前信息和通信技术行业占全球碳排放量的2%[7] 。这个比例虽然看起来不多,但是每年的复合增长率却达到了6%[8]。

  引领行业进入高能效未来

  AMD正在积极扩张市场,力求把高能效计算推向所有新的产品领域。公司将功耗管理技术和设计方法应用于各个业务线的处理器研发。AMD即将推出的高密度处理器产品采用ARM核心,将为云计算提供出色的每瓦性能。公司还将继续大力投入独立GPU技术的研发,以期带来更高的图形和计算性能。AMD将把APU功耗管理技术也用于GPU,为后者带来更高的能效。APU融合了AMD所有的技术成果,可以满足最严苛的高能效计算要求。例如,在移动处理器领域,公司将通过异构计算和高级功耗管理技术在2020年实现预计25倍一般使用能效的提升——与2008年AMD刚开始大力改善能效时相比提升更是达到250倍。

  AMD认为HSA减少了对APU上的CPU的依赖,是提升高度并行工作负载性能和降低功耗的根本举措。除了GPU,公司还在APU上集成了单一功能加速器,它类似于智能手机芯片设计人员开发的一种组件。这些专用加速器占用的芯片空间极小,可以用最低的功耗实现高效的性能。其劣势在于可编程性较差,难以兼容新的算法。其他可编程单元,如数字信号处理器(DSP)有出色的通信和音频处理能力,可以完成原本由CPU核心处理的这类任务。例如,AMD在最新的APU和GPU上集成了DSP来完成CPU的音频处理任务。对音频处理等工作负载来说,与单纯用CPU来处理相比,在架构上增加一些小组件可以使能效提升2倍到接近25倍不等2。

  我们期待在更远的未来,AMD能在扩大业务范围的同时,持续对高能效设计进行投入。公司将凭借整合高性能显卡的成功经验,进一步改进智能功耗管理、异构计算、高能效CPU、GPU以及APU;同时它也将继续改进处理器的集成和制程技术。当半导体行业面临新的挑战时——比如晶体管成本增加导致制程提升的优势不再明显,AMD就可以很好地发挥在高能效处理器设计方面的先发优势。

  [1]能源之星计划电脑要求准则修订版6.0(2013年10月)对ETEC—笔记本电脑一般功耗——作出了详细说明。

  [2] 以SpecIntRate、PassMark和PCMark等常见性能测试测量计算性能并取比值定义的一般使用功耗为基础,除以用能源之星程序要求Rev 6.0 10/2013 ETEC(笔记本电脑一般功耗)等衡量标准定义的一般能源使用。

  [3] Koomey, J.G., Berard, S., Sanchez, M.和Wong, H. “高能效计算历史趋势带来的启示,” 《美国电气电子工程师学会计算编年史》2011年3号第33期。

  [4] 由SpecIntRate、PassMark和PCMark等常用性能测试测量得出

  [5] Bouvier, D., Cohen, B., Fry, W., Godey, S.和Mantor, M. “Kabini:AMD加速处理器系统级芯片,”《美国电气电子工程师学会计算机期刊》2014年2号第34期。

  [6] 同上。.

  [7] 根据国际能源协会(IEA)《2013年世界能源展望》的“核心论题”,温室排放到2035年将增加20%,导致地球变热大概3.6°C。这远高于国际上公认的2°C.

  [8] 从2002至2011年,信息与通信技术行业温室气体排放增长率是每年6.1%;2011至2020年增长率将降至每年3.8%。GeSI, SMARTer 2020:信息技术行业对可持续发展未来的作用,2012年12月; http://gesi.org/SMARTer2020


比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部