深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意( 五 )



深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图11/17


深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图12/17

GPU 这边规模大 , 频率高 , 但 3DMark Wild Life 测试的峰值性能只比Exynos 2100 高 21% 。 在 GFX Bench 的 Aztec 场景测试中 , 领先Exynos 2100 14% , 小幅领先骁龙 888 。 虽然采用了分频设计 , 但貌似瓶颈在 GPU 的其他地方 。
Tensor 的 GPU 峰值功率高达 9-10W , 手机一跑就降频(一轮测试都没跑完啊……) , 拖低了整体功耗 , 所以才会有 7.28 W 的平均功耗 。 Pixel 6 系列没有热管 , 散热配置和机身结构更像是 iPhone , 而不是猛堆散热的安卓旗舰 。 它跑起来时 , 左侧的 SoC 45 度 , 但右侧只有 30-33 度 , 散热确实是弱 。
让人不解的是 , 今年这批 SoC 都设定了高得不切实际的 GPU 频率 , 一跑就降频 。 可能是为了应对突发的 GPU 负载?或者是其他什么原因?但无论怎么样 , 实际能效比是受累了 。
TPU:极强的推理性能
这是 Google Tensor 挽回颜面的地方 。 MLPerf 测试中 , Pixel 是在 NNAPI 跑的 , 其他厂商是各自的库 , 高通是 SNPE(最近优化了 MLPerf 1.1 , 提升了成绩)、三星是 EDEN , 联发科是 Neuron , 而苹果没有 coreML 加速 , 所以吃亏 。

深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图13/17

在图像分类、目标检测和图像分割工作负载中 , Tensor 成绩低于高通 , 但强于三星 。 而在语言处理(MobileBERT 模型) , Google Tensor 提供了骁龙 888 3 倍的性能 , 推理部分强得很 。 Google 在宣传里 , 确实也提到过实时转录、翻译等使用场景是其差异化所在 。

深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图14/17


深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图15/17


深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图16/17

还没发布的 GeekBench ML 测试 , 用是 TensorFlow 模型 , 代表的是 GPU 的机器学习性能 。 这时候 Google Tensor 就弱于Exynos 2100 。 如果用 NNAPI 模型 , 此时是 CPU+GPU+NPU 的混合工作 , Google Tensor 就可以大幅领先骁龙 888 。
除了绝对性能 , 跑 AI 测试时 , Pixel 6 Pro 的整机功耗和 Exynos 2100 的 Galaxy S21 Ultra 接近 。 单独进行推理任务时 , Exynos 2100 的爆发功率达到 14W , 骁龙 888 也有 12W 。 但因为 Google Tensor 的 AI 性能更高 , 所以最终能效比要更高一些 。
不过 Google 还没有计划推出相关的 SDK 让开发者去更好地利用这颗强大的 TPU。 但再看看三星 , 它的 NPU 发布都 2 年了 , 现在都没有 SDK…… 现在 TPU 的强大性能 , 主要集中体现在官方 App 里 , 像是给摄像头加入更多的机器学习功能 , 以及各种翻译功能 。
总结

深度整理:谷歌Tensor自研手机芯片规格分析,实际性能不尽如人意

文章图片
图17/17

Google 表示 , 他们搞自研 SoC 的主要原因是现有的 SoC 在机器学习上的性能和能效比太低 。 而 Tensor 的机器学习性能和能效 , 被用来支撑新的用例和体验 , 例如我们在 Pixel 6 系列上看到的很多机器学习特性 。 像是实时转录、实时翻译和图像处理等算法 , 所有这些都是运行在 Tensor 的 TPU 上的 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。