译文 | Tensor 之意不在「酒」:Google Silicon 团队专访,为你揭开定制芯片的秘密

编注:本文首发于 Ars Technica , 原文, 原文作者。
少数派经授权翻译、转载 , 在不影响原文内容前提下 , 仅对结构进行适当调整 。
Pixel 6 终于 官宣了!它有着全新的相机模组设计、超乎预期的平实定价以及最新的 Android 12 操作系统 。 但无论如何 , 这部手机最值得我们大书特书的部件一定是 Google Tensor 这颗「片上系统」 , 也就是所谓的 SoC 。 作为智能手机中首款由 Google 主导的 SoC , 这块芯片有着独特的 CPU 核心架构方式 , 对 AI 任务的处理能力也是十分重视 。
不过 Google 究竟是从什么时候开始造芯片的?Tensor SoC 想要达成的目标是什么?它又为何采用了如此独特的设计方式?为了弄清这些问题 , 我们和一个此前闻所未闻的新团队 —— Google Silicon 聊了聊 。
Google Silicon 是一个由 Google 专攻移动端芯片的相关负责人所组成的团队 , 换句话说 , Pixel 3 及其后续机型中的 Titan M 安全芯片、Pixel 2 和 Pixel 3 中的 均出自他们之手 。 他们在定制 SoC 的开发上已经投入了三四年的时间 , 但仍然独立于 Google Cloud 的芯片开发团队 , 后者的成果包括 、云端 加速单元等 。
【译文 | Tensor 之意不在「酒」:Google Silicon 团队专访,为你揭开定制芯片的秘密】今天我们就请到了 Google Silicon 团队的副总裁兼总经理菲尔·卡马克(Phil Carmack)和团队高级主管莫妮卡 · 古普塔(Monika Gupta) , 二位将向我们透露更多有关这颗芯片的秘密 。
Google Tensor 的独特设计
大多数移动 SoC 供应商都要从 ARM 来获取芯片架构的授权 , ARM 同时也会就如何使用其核心进行芯片设计提供一些(非强制的)设计指导 。 除了 Apple , 大多数定制芯片的设计都会遵循 ARM 这套设计指导 , 比如今年最为常见的设计方案:一颗 ARM Cortex-X1 大核心、三颗 A78 中核心以及 4 个频率更低、功耗更低的用来处理后台任务的 A55 小核心 。
现在让我们回想一下 Google 的做法:在 Google Tensor 中 , 小核心仍然是四颗 A55 , 但它配备了 2 颗频率为 2.8 GHz 的 ARM Cortex-X1 大核心 , 用于处理前台任务 。
至于「中核心」 , Google Tensor 采用的 CPU 是 2 颗 2.25 GHz 的 A76(和其它家都在用的 A78 不同 , 这里采用的是 A76 —— A76 去年往往都被大家用在「大核」上1) 。 根据 ARM 在向业界引入 A78 设计时的说法 , 在相同的核心热上限(thermal envelope)条件下 , 这颗采用 5nm 制程的核心相比采用 7nm 制程的 A76 在持续性能输出上提高了 20% 。 Google 则在一颗采用 5nm 制程的芯片上采用了 A76 的设计 , 以 ARM 的描述为基础 , Google 这颗 A76 核心发热应该比 A78 更少 。
总而言之 , Google Tensor 在散热设计上为两颗大核心倾斜了更多资源 , 中核心上则相对节制了些 。
核心的「大」与「小」之争
因此我们向 Google Silicon 团队抛出的第一个问题正是:为什么要用这样的核心设计方案?
卡马克的解释是 , Google Tensor 双 X1 架构通过在「中等负载」下运行的方式来提升整体效率 。 「我们大部分精力都集中在了如何配置运行负载、如何在芯片内部分配能源以及处理器如何在不同的时间点上发挥作用上」卡马克说 , 「Android 系统往往会在运行负载较为繁重时『倾巢出动』 , 而这正是我们想要处理得更加灵活的地方 。 」
这里所说的其实是在大部分移动芯片中都有体现的 rush to sleep策略:在处理诸如网页加载这种任务时 , 处理器往往会将所有可能的资源都投入进去 , 以此达到快速完成任务、并让设备回归到低功耗状态的目的 。
「在那种不急不缓的状态下 , 比如说 CPU 的负载没那么高、但也不算太轻的时候 , 两颗 X1 核心同时工作所提供到的性能其实也是最为高效的 , 」卡马克说 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。