谷歌TPU 3.0到底厉害在哪里?

来源:StarryHeavensAbove
作者:唐杉
Google在I/O大会上发布了TPU3,虽然目前详细信息不多,但下面几点还是值得讨论:8倍性能;快速迭代;云服务和Benchmark。TPU3到底哪里厉害?

8倍性能
今天的新闻中我们都可以看到如下描述“Google CEO Sundar Pichai said the new TPU is eight times more powerful than last year per pod, with up to 100 petaflops in performance.”也就是说一个TPU3 pod的总处理能力100 PFLOPS是TPU2 pod的8倍。
从下图我们可以看一下TPU3 pod和TPU2 pod的对比。

TPU2的一个pod包括4个rack,两个CPU rack(左右两边),两个TPU rack(中间两个)。每个rack有32个computing unit (板卡),每个TPU板卡有4颗TPU芯片。因此一个pod总共有64 x 4颗TPU2芯片。每颗TPU2芯片的处理能力是45TFLOPS,因此一个pod总的处理能力是45 x 4 x 64 = 11.5 PFLOPS.


对比来看,TPU3的板卡仍然包括4颗芯片。但目测TPU3 pod的rack数量和板卡的密度(这个看的不是很清楚)和TPU2相比都增加了一倍。因此,一个pod中的TPU3芯片的数量应该是之前4倍。如果pod的总处理能力是TPU2的8倍,那么TPU3单芯片的处理能力则为TPU2的2倍。
根据Google的说法,这次他们第一次在Data center采用水冷的散热方式,这可能和芯片功耗以及板卡密度增加有关系。
Google also said this is the first time the company has had to include liquidcooling in its data centers, CEO Sundar Pichai said.

总得来说,如上图所描述(来自Google I/O大会的talk:Effective Machine Learning with Google TPU,可以在YouTube上搜索Google io 18 stage 8观看),TPU3实现的超过100 PFLOPS的处理能力是来自“新的芯片架构和大规模系统”。
快速迭代
从去年I/O大会发布TPU2到今天不过一年时间,Google的芯片迭代速度还是非常惊人的。“为什么Google能够实现这样的快速迭代?”这也是一个非常值得探讨的话题。
我先简单谈几点个人看法:
第一,TPU是一个Domain-specific Architecture(参考当我们设计一个专用处理器的时候我们在干什么?(上)),定位准确,架构简单,容易扩展。相比之下,传统的通用处理器必须考虑灵活性和兼容性,有太重的包袱。当然,TPU这种特点也决定它只能用于有限的应用场景,可能只有Google的体量以及云服务能够所提供的应用需求才能充分利用TPU这种专用芯片,这一点是得天独厚的。这也是目前几乎所有科技巨头都开始自研芯片的一个基本考量。而传统的芯片厂商在这一点上就有些尴尬了。[page]分页标题[/page]
第二,Google的软件和系统能力超强,TPU以Cloud service出现,提高给客户的是整体服务。芯片硬件可做的tradeoff空间比较大,芯片本身的弱点可以在系统层面弥补。从目前得到的信息分析的,TPU3的处理能力是TPU2的8倍,其中芯片换代的贡献只有2倍,大部分改进在系统层面。另一方面,目前芯片开发离不开相关软件工具,Google的软件能力和生态也是其能够实现芯片快速迭代的一个重要因素。
第三,钱很重要。Google不差钱,在芯片实现上可以通过花钱换取时间。
总得来说,Google TPU的意义可能远远超过芯片本身。它背后的芯片设计逻辑,实现方法,应用模式和生态环境,相较传统芯片开发有很大区别,也许会成为趋势。
云服务和Benchmark
Google在发布TPU3的时候同时提到了新的云服务,在之前的Cloud TPU基础上,今年晚些时候还会发布Cloud TPU pod(不知道谁能用的起?
),可以看出TPU对于Goolge的云端战略的重要意义。

有意思的是,在Google的talk中强调了cost的问题,每个例子都给出了相应的training cost,画风是这样的。

这里颇有广告的感觉,不禁让人想起黄教主的”The more GPUs you buy, The more money you save“。结合最近Microsoft对Brainwave项目的宣传,感觉云端机器学习的价格战马上就要开始了。
另外,Google也强调了Benchmark的重要性,还专门展示了他们最近力推的MLPerf。

最近不同平台之间的对比很多,有比性能的,也有拼成本的。相信随着越来越多的厂商加入,刷榜应该会非常热闹。
本文首发于微信公众号:新智元。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 08:51聚东山智慧 谋发展新篇 2025东山大会在浙江绍兴举办
- 19:22要求所有售后服务商停止小米和格力业务?美的辟谣
- 14:49金海汇成投资有限公司财富增长的双轮驱动
- 16:19四川水井坊邛崃全产业链基地:传承非遗技艺,坚持开放发展
- 16:44金海汇成投资有限公司财富增长的方法论基石
- 18:01易萃享:27 年康力匠心,铸就数智健康新标杆
- 17:54易萃享:以数智之力,让健康管理触手可及
- 17:27易萃享:不止是营养机,更是家庭健康管理中心
- 17:19易萃享:AI 赋能,解锁 “一人一案” 的营养新范式
- 17:09易萃享:1000 日夜打磨,让精准营养走进寻常家
- 19:41政产协企四方联动 | 浙江省住建厅、九牧、链筑、房企共研:好房子需配备智
- 19:40武汉智博会 | 卫浴独家!九牧携产业链伙伴智造中国“好房子”
- 19:39九牧领跑科技卫浴新赛道,“好房子” 实践响应十五五规划
- 20:40东方药林百年纳:科技赋能 开启活力健康新航程
- 20:35东方药林百年纳:四大专利加持 解锁现代健康新方案
- 20:29东方药林魔术丝:传承本草智慧 点亮现代秀发之美
- 20:18魔术丝白黑客防脱育发液:天然植萃赋能 解锁秀发焕变密码
- 20:06竹奥秘毛巾:东方药林创新竹锟科技的匠心之作
- 19:23东方药林竹奥秘:解锁竹萃能量 重塑健康生活理念
- 12:21南京市人才一期发展基金合伙企业子基金遴选结果公布
- 18:43水井坊发布2025年前三季度业绩报告
- 17:58去信任的商业文明:当算法取代权威,当信任回归众人
- 20:29助推高质量产业发展·创投实录|华青领创:敢于“掀桌”,方见新“视界”
- 12:32“第一届传媒可持续发展·ESG作品榜”正式发布 2025企业可持续发展大
- 18:28【一个世界 无限场景】泽瑞萬象元宇宙计划正式启动 & 全球首秀
- 07:45纳米晶体甲地孕酮,让肿瘤患者体重“向上”,生存“向上”
- 21:40创投集团直投企业瑞为新材获得第七批专精特新“小巨人”企业认定
- 12:19九牧智能卫浴助建中国“好房子”,杭州好房子私享会今日召开!
- 14:04金海汇成投资有限公司如何打造高效资产证券化产品
- 17:01ChainVault亮相伦敦区块链大会:引爆欧洲RWA新风口



