译文 | Tensor 之意不在「酒」:Google Silicon 团队专访,为你揭开定制芯片的秘密( 二 )


这里他将相机取景器作为中等负载的例子 , 卡马克表示 , 「打开相机后 , 除了现实世界会被你一并收入屏幕上的实时预览当中 , 背后也有很多有趣的事情正在同时进行 。 比如因为 Google Lens 正在进行图像检测这样的任务 , 那我们就会同时用到图像计算、渲染计算和机器学习(machine learning)计算 。 这样的使用情景会牵涉到大量的计算任务 , 这些计算任务也可谓各不相同 。 」
稍微插一句 , 这里的「各不相同」(heterogeneous)意思是用到了 SoC 中不止 CPU 的部分进行计算 , 就以上面的 Google Lens 为例 , CPU、GPU、ISP(图像协同处理器)以及 Google 的机器学习协同处理器在这个过程中都有参与 。
卡马克继续说 , 「你也许会想 , 要是用两颗降频的 X1 来处理岂不是又快又省电 , 但这样一来负载还是会变得挺重的;相比之下 , 不如将这种此前一般来说需要两颗 A76 火力全开来处理的任务交给两颗 X1 来处理 , 同样的负载对后者来说或许只需要轻轻踩下『油门』」 。
拍摄的确是一个不错的参考案例 , 因为之前 Pixel 手机正是在这一项上栽过跟头的 。 尽管现阶段2我还无法透露更多信息 , 但 Pixel 5 和 Pixel 5a 确实只消 3 分钟 4K 画质的视频录制就会过热 , 而在 Pixel 6 上同样画质参数的我进行了 20 分钟的视频录制 , 并没有遇到过热问题(只拍了 20 分钟是因为我累了) 。
译文 | Tensor 之意不在「酒」:Google Silicon 团队专访,为你揭开定制芯片的秘密
文章图片

图注:手机就长这个样子 。
所以说 , Google 此举是想用行动向「只用一个大核才是好设计」这一说法表示反对吗?毕竟尺寸巨大的单个「顶级大核心 (prime core)」也是最近才在 ARM 架构中出现的 , 我们此前常见的方案一般都是 4 个大核心加上 4 个小核心完事 。
「一切都与你想达成的目的有关 , 」卡马克说 , 「我来告诉你什么情况下一个大核心能比过两个:当你的目标是赢得单线程基准测试的时候 , 你只需要给这颗大核塞进更多的逻辑门电路就行了 。 但如果你还需要更灵活的响应速度 , 用最高效的方式来达到高性能 , 最快的实现路径恐怕还是得用两颗大核心 。 」
卡马克警告说这种做法「视效能分配重心在这一代产品和下一代产品升级中的变化 , 未来也有可能会继续演进 , 」但就现目前的 X1 来说 , Google 还是认为它相比传统的设计方式是更加优秀的 。
「相比于我们的上一代产品 , Google Tensor 的单核性能快了 80% , GPU 性能则有 370% 的提升 。 我提到这一点是因为我知道人们会这样问 。 但对我们来说这其实并不是重点 , 」卡马克解释说 , 「我们更希望大家从中明白的一点是 , 虽然我们是初涉 SoC 领域的团队 , 但我们知道要如何打造一块设计精密、运行快速同时功能强大的高频率、高性能电路……无论是频率还是每瓦性能(frequency per watt) , 在这类参数上我们都有非常扎实可靠的实现路径 。 但这并不是我们打造这块全新 Tensor SoC 的理由 。 」
硬件加软件 , 意还在 AI
没错 , 既然 Google 想要定制 SoC , 他们造出来的肯定不是传统意义上的智能手机 SoC 。 Google 想要将人工智能和机器学习的设备端处理能力再向前推进一步 , 就芯片设计这件事而言 , Google 的出发点自然也是「最有 Google 味」的地方 。
「从一家公司的角度来说 , Google 希望将 AI 应用到日常生活中的方方面面 , 」Google Silicon 高级主管莫妮卡 · 古普塔说 , 「我们自己的咖啡厅菜单说不定就是基于大家的习惯和配方偏好、由 AI 分析并制定的呢 。 」
我很乐意给你展示一系列数据来说明 Google Tensor 的 AI 处理能力有多强大 , 但 Google 对 TeraOPS(Tera Operations Per Second , 万亿操作每秒)这样的 AI 参数也并不感兴趣 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。