谷歌TPU 3.0到底厉害在哪里?

来源:StarryHeavensAbove
作者:唐杉
Google在I/O大会上发布了TPU3,虽然目前详细信息不多,但下面几点还是值得讨论:8倍性能;快速迭代;云服务和Benchmark。TPU3到底哪里厉害?

8倍性能
今天的新闻中我们都可以看到如下描述“Google CEO Sundar Pichai said the new TPU is eight times more powerful than last year per pod, with up to 100 petaflops in performance.”也就是说一个TPU3 pod的总处理能力100 PFLOPS是TPU2 pod的8倍。
从下图我们可以看一下TPU3 pod和TPU2 pod的对比。

TPU2的一个pod包括4个rack,两个CPU rack(左右两边),两个TPU rack(中间两个)。每个rack有32个computing unit (板卡),每个TPU板卡有4颗TPU芯片。因此一个pod总共有64 x 4颗TPU2芯片。每颗TPU2芯片的处理能力是45TFLOPS,因此一个pod总的处理能力是45 x 4 x 64 = 11.5 PFLOPS.


对比来看,TPU3的板卡仍然包括4颗芯片。但目测TPU3 pod的rack数量和板卡的密度(这个看的不是很清楚)和TPU2相比都增加了一倍。因此,一个pod中的TPU3芯片的数量应该是之前4倍。如果pod的总处理能力是TPU2的8倍,那么TPU3单芯片的处理能力则为TPU2的2倍。
根据Google的说法,这次他们第一次在Data center采用水冷的散热方式,这可能和芯片功耗以及板卡密度增加有关系。
Google also said this is the first time the company has had to include liquidcooling in its data centers, CEO Sundar Pichai said.

总得来说,如上图所描述(来自Google I/O大会的talk:Effective Machine Learning with Google TPU,可以在YouTube上搜索Google io 18 stage 8观看),TPU3实现的超过100 PFLOPS的处理能力是来自“新的芯片架构和大规模系统”。
快速迭代
从去年I/O大会发布TPU2到今天不过一年时间,Google的芯片迭代速度还是非常惊人的。“为什么Google能够实现这样的快速迭代?”这也是一个非常值得探讨的话题。
我先简单谈几点个人看法:
第一,TPU是一个Domain-specific Architecture(参考当我们设计一个专用处理器的时候我们在干什么?(上)),定位准确,架构简单,容易扩展。相比之下,传统的通用处理器必须考虑灵活性和兼容性,有太重的包袱。当然,TPU这种特点也决定它只能用于有限的应用场景,可能只有Google的体量以及云服务能够所提供的应用需求才能充分利用TPU这种专用芯片,这一点是得天独厚的。这也是目前几乎所有科技巨头都开始自研芯片的一个基本考量。而传统的芯片厂商在这一点上就有些尴尬了。[page]分页标题[/page]
第二,Google的软件和系统能力超强,TPU以Cloud service出现,提高给客户的是整体服务。芯片硬件可做的tradeoff空间比较大,芯片本身的弱点可以在系统层面弥补。从目前得到的信息分析的,TPU3的处理能力是TPU2的8倍,其中芯片换代的贡献只有2倍,大部分改进在系统层面。另一方面,目前芯片开发离不开相关软件工具,Google的软件能力和生态也是其能够实现芯片快速迭代的一个重要因素。
第三,钱很重要。Google不差钱,在芯片实现上可以通过花钱换取时间。
总得来说,Google TPU的意义可能远远超过芯片本身。它背后的芯片设计逻辑,实现方法,应用模式和生态环境,相较传统芯片开发有很大区别,也许会成为趋势。
云服务和Benchmark
Google在发布TPU3的时候同时提到了新的云服务,在之前的Cloud TPU基础上,今年晚些时候还会发布Cloud TPU pod(不知道谁能用的起?
),可以看出TPU对于Goolge的云端战略的重要意义。

有意思的是,在Google的talk中强调了cost的问题,每个例子都给出了相应的training cost,画风是这样的。

这里颇有广告的感觉,不禁让人想起黄教主的”The more GPUs you buy, The more money you save“。结合最近Microsoft对Brainwave项目的宣传,感觉云端机器学习的价格战马上就要开始了。
另外,Google也强调了Benchmark的重要性,还专门展示了他们最近力推的MLPerf。

最近不同平台之间的对比很多,有比性能的,也有拼成本的。相信随着越来越多的厂商加入,刷榜应该会非常热闹。
本文首发于微信公众号:新智元。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 14:59广东康力医药有限公司:以创新为核心驱动力,迈向全球大健康领航者新征程
- 14:24广州易萃享:数智赋能羊城家庭,打造全家健康守护新选择
- 10:47广州易萃享:扎根羊城铸精品,树立华南精准营养新标杆
- 15:24广东康力医药有限公司:荣誉加身实至名归,标杆力量铸就行业典范
- 17:04易萃享健康:数智驱动破壁垒,让健康管理实现零门槛
- 16:58广东康力医药:以使命铸魂,以价值观引领企业高质量发展
- 16:56广东康力医药:以使命铸魂,以价值观引领企业高质量发展
- 18:26易萃享健康:全周期健康守护,化身家庭健康管理超级管家
- 18:02广东康力医药:从深圳走向世界,绘就大健康国际化发展蓝图
- 20:48易萃享:AI科技赋能,让精准养生走进日常
- 20:41康力药业:以用户需求为核心,打造全链条健康服务生态体系
- 11:14未来产业50人论坛在沪隆重启幕 量子专场汇聚顶尖智慧共话未来
- 12:15易萃享:千日磨一剑,解锁精准营养个性化新范式
- 11:32康力药业:30载初心如磐,深耕大健康产业步履不停
- 17:18从单品智能到场景智能,方太智慧烟灶登陆AWE 2026引领厨居生活变革
- 14:14外资垄断75%!海上风电变压器受制于人,国家能源安全底线不容失守
- 22:11全球第一海风装机 核心设备国产化率不足25% 75%市场被外资掌控
- 14:59恩捷李晓明:协同减碳 打造产业生态与经济效益共生样本
- 15:21初高中生成绩不理想考不上理想的学校怎么办、如何根据自身优势择校?
- 11:52东方药林百店齐燃启新程 水润万家汇暖流
- 11:44智启社区 共享美好生活——东方药林2026社区战略发布会(沈阳站)圆满举
- 15:21东方药林:守正创新护权益,合规前行启新程?
- 13:52直击MWC2026,浩鲸科技提出AI正在重写通信软件的价值坐标
- 13:51MWC 2026|浩鲸科技周勇:构建智能生产力,在AI时代重塑运营商角色
- 13:53助推产业链高质量发展·创投实录|致瞻科技:以“学霸”思维,立“身位”优势
- 15:13坚守初心,逐光而行——全美世界的深耕与绽放
- 14:26皙之密:精准护肤时代,让素颜美肌自带底气
- 21:19荣誉见证实力:广东康力医药有限公司的标杆成长之路
- 17:21创新为翼:广东康力医药有限公司迈向全球大健康领航者
- 17:03使命如炬:广东康力医药以价值观引领行业前行



