南靖| 康保| 遂昌| 肃宁| 荣成| 吉隆| 阳春| 长治县| 新干| 龙泉| 邕宁| 新干| 资溪| 长治县| 江川| 同安| 栖霞| 酉阳| 宿松| 库车| 阜阳| 吴中| 遂川| 洞头| 栖霞| 鄂州| 洛宁| 永登| 久治| 本溪市| 铁岭市| 礼县| 武城| 东至| 广宗| 商洛| 武清| 兴义| 湖口| 沙县| 仁怀| 瑞丽| 潞西| 东港| 开阳| 长岭| 绥阳| 邯郸| 逊克| 吉木萨尔| 惠山| 蓬安| 连城| 徐州| 高平| 双牌| 武隆| 枝江| 下陆| 芜湖市| 宝清| 安图| 邗江| 高陵| 左贡| 九台| 定安| 峡江| 六盘水| 金门| 响水| 临颍| 乌达| 津市| 遂昌| 鲅鱼圈| 临西| 灵寿| 清水| 铜陵县| 民权| 突泉| 绥棱| 西华| 柘荣| 紫云| 城步| 肃北| 南澳| 连城| 大宁| 芜湖市| 清河门| 牟平| 巴塘| 玛纳斯| 凌海| 岳阳县| 隆昌| 邢台| 高唐| 麻栗坡| 句容| 南丰| 屏边| 沁源| 索县| 突泉| 湘东| 珊瑚岛| 湘东| 余江| 嵩县| 留坝| 葫芦岛| 邗江| 汪清| 和平| 阳春| 凌海| 巫溪| 来安| 宜宾市| 青海| 百色| 陇西| 肃宁| 政和| 惠阳| 临西| 蓬安| 罗山| 米易| 郏县| 惠阳| 贵定| 重庆| 扬州| 美溪| 根河| 中山| 南通| 保德| 湾里| 和顺| 陆丰| 新蔡| 泾阳| 临桂| 田林| 玉屏| 崇礼| 抚松| 嘉义县| 威海| 浦城| 覃塘| 商水| 蒙城| 龙泉驿| 苗栗| 广宗| 澄海| 通江| 瑞金| 黄冈| 旬邑| 江源| 新晃| 兰坪| 兴县| 河间| 融安| 望江| 卓资| 河北| 陆川| 上高| 雄县| 巴马| 公安| 阜宁| 博湖| 新乐| 神农顶| 江宁| 嘉黎| 博鳌| 兴业| 郫县| 资源| 沂南| 廉江| 西丰| 库伦旗| 北碚| 连山| 田东| 湘潭县| 江山| 那坡| 陆河| 临武| 林州| 临安| 荔浦| 黄陂| 保靖| 南海镇| 清河| 雷州| 福泉| 沿滩| 黄埔| 永登| 景县| 五营| 古田| 神农架林区| 明水| 元阳| 谷城| 黄骅| 呼伦贝尔| 乡宁| 新乐| 新平| 盱眙| 雅江| 乌拉特后旗| 巴青| 大姚| 西乌珠穆沁旗| 澳门| 神农顶| 尼木| 河池| 旬阳| 纳雍| 中卫| 明溪| 本溪市| 平南| 乌恰| 磴口| 金山| 舒城| 万源| 玉龙| 鹤岗| 晋中| 横山| 达州| 红原| 东至| 新郑| 平坝| 嵊泗| 周村| 德州| 肇州| 沁水| 双城|

俄罗斯承认差距 解放军已能全面压制俄军(1)-海外视角

2019-10-14 19:12 来源:爱丽婚嫁网

  俄罗斯承认差距 解放军已能全面压制俄军(1)-海外视角

  ”朱国平说,当初带着“天府”上玉树的黄平已经退伍,但这个故事中队几乎人人都听过,“废墟上到处是浓烟,对它嗅觉也有影响。回看这次并购,2017年12月12日,神州数码集团()发布公告,拟以亿元收购广东启行教育科技有限公司100%股权,其中,以现金亿元支付对价,以亿股支付亿股对价。

截至5月4日20时,受汇市干预引发香港银行间结余资金持续缩减冲击,港元3个月拆借利率(HIBOR)触及2008年12月以来最高值%,令同期美元-港元利差收窄至近期低点75个基点,但与此形成鲜明反差的是,港元兑美元汇率持续徘徊在附近,离弱势兑换保证价格仅差4个基点。北斗卫星导航系统是我国自主建设、独立运营的全球卫星定位导航系统,不但是我国重大科技创新成果,还正在形成以北斗卫星导航系统为核心的高技术产业。

  超大规模基金如何控制风险、做好投资标的审查,这是兴全基金面临的考验上市首日即触及跌停,收盘下跌%——昔日爆款基金兴全合宜场内交易的跌宕走势引发了市场的极大关注。其实《芳华》的上映之路并不顺畅,原定于国庆期间上映,却在9月末临时宣布撤档。

  也就是说,2017年,冯小刚要为公司完成的净利润将达到亿元。这一切成绩的背后都离不开强大研发实力与一流的研发团队。

在这份最新的招股书中,三只松鼠2017年上半年的净利润达到亿元,较2016年全年净利润多400万元。

  例如中邮消费金融公司年度净利润6775万元;招联消费金融公司净利润亿元,同比增加倍;捷信消费金融公司亿元,同比增加%;马上消费金融公司净利润亿元,同比增加倍;中银消费金融2017年上半年就实现营业收入20亿元,同比快速增长%,净利润亿元,同比增长192%……业内人士指出,虽然去年年底出台了一系列整治现金贷、网络小贷公司等监管政策,但由于文件落地是在去年年底,对持牌消费金融公司全年业绩影响较小,总体来看消费金融仍然有着广阔的发展前景。

  目前,我国卫星导航产业发展势头良好,《2018中国卫星导航与位置服务产业发展白皮书》介绍,北斗卫星导航系统正式开通5年来,已广泛应用于交通、海事、电力、民政、气象、渔业、测绘市政管网等十几个行业领域,各类国产北斗终端产品推广应用已累计超过4000万台/套,包括智能手机在内的采用北斗兼容芯片的终端产品社会用户总保有量接近5亿台/套。不过基金的场内交易价格并不等同于资产价值,折价并不意味着基金出现亏损。

  一时间各种猜测四起,有不明来源消息称,该片撤档是因为触及敏感题材。

  【活动亮点】1.与国家机构协会联合2.针对民族品牌,与属性吻合3.将品牌、技术、产品与民族爱国情绪的融合,形成共鸣传播4.通过网站传播,微博,论坛,社区配合传播,搭配wap,app进行扩散,全媒体合作,多渠道推广。然而在中国的舜宇光学科技(集团)有限公司,最富有的员工同样可能是车间工人、门卫或者食堂的厨师。

  朱国平悉心照料的时候,总为它担忧,可这一天终于还是到来。

  ■本报见习记者谢若琳2年前,华谊兄弟收购冯小刚控股的“空壳公司”浙江东阳美拉传媒有限公司(以下简称“东阳美拉”)70%股权。

  SNPLUS油品:先进的“TGDI保护技术”,专为涡轮增压直喷发动机设计。到2020年底,将建成包括35颗卫星的全球覆盖系统,为全球用户提供定位、导航等服务。

  

  俄罗斯承认差距 解放军已能全面压制俄军(1)-海外视角

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

本文作者:程弢 2019-10-14 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
润铠胜的实际控制人正是赖淦锋。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
东马路培红 塔丁乡 承德市 旧宫三村 石牌镇
玉瓜坑 大辛店镇 旧镇政府 任坑 西上庄街道
技术支持:蜘蛛池 www.kelongchi.com