文章图片
神经架构搜索发现的 Primer 架构 , 效率是 plain Transformer 模型的 4 倍 。
五是稀疏性的使用 。 所谓稀疏性 , 即模型具有非常大的容量 , 但只有一部分针对给定的任务、示例或 token 而被激活 。 稀疏性是另一个重大的算法进步 , 可以极大地提升效率 。
2017 年 , 我们提出了稀疏门混合专家层(sparsely-gated mixture-of-experts layers) , 使用计算量比当时 SOTA 密集 LSTM 模型少 10 倍时在多个翻译基准上实现更好结果 。 还有最近的 Swin Transformer , 将混合专家风格的架构与 Transformer 模型架构结合 , 结果显示训练时间和效率均实现了较密集 T5-Base Transformer 模型 7 倍的加速 。 稀疏性概念还可以用来降低核心 Transformer 架构中注意力机制的成本 。
文章图片
谷歌研究院提出的 BigBird 稀疏注意力模型由处理输入序列所有部分的全局 token、局部 token 和一系列随机 token 组成 。
趋势 3:机器学习变得更个性化 , 对社区也更有益
随着机器学习和硅硬件(如谷歌 Pixel 6 上的谷歌张量处理器)的创新 , 许多新体验成为了可能 , 使移动设备更有能力持续有效地感知周围的背景和环境 。 这些进步提升了可访问性和易用性 , 同时也增强了计算能力 , 对于移动摄影、实时翻译等功能至关重要 。 值得注意的是 , 最近的技术进步还为用户提供了更加个性化的体验 , 同时加强了隐私保护 。
可以看到 , 更多的人比以往任何时候都要依靠手机摄像头来记录他们的日常生活并进行艺术表达 。 机器学习在计算摄影中的巧妙应用不断提升了手机摄像头的功能 , 使其更易于使用、性能更强并生成更高质量的图像 。
例如 , 改进的 HDR+、在极低光下拍照的能力、更好地人像处理能力、以及适用于所有肤色的更具包容性的相机 , 所有这些进步都使用户可以拍摄出更好的照片 。 使用 Google Photos 中现在提供的基于 ML 的强大工具 , 如电影照片(Cinematic Photo)等 , 进一步提高了照片拍摄效果 。
文章图片
HDR + 从一组全分辨率的原始图像开始 , 每张都有相同的曝光度(图左);合并后的图像减少了噪声 , 增加了动态范围 , 从而得到更高质量的最终图像(图右) 。
除了使用手机进行创意表达外 , 许多人还依靠手机来与他人实时沟通 , 使用消息应用中的 Live Translate 和 Live Caption 进行电话通话 。
得益于自监督学习和嘈杂学生训练等技术 , 语音识别的准确性继续提升 , 在重音、嘈杂条件或重叠语音的环境以及多语言任务中都有显著改善 。 基于文本到语音合成的进步 , 人们可以在越来越多的平台上使用谷歌 Read Aloud 服务收听网页和文章 , 从而使信息更容易跨越形态和语言的障碍 。
文章图片
最近一项研究表明 , 注视识别能力是精神疲劳的一个重要生物标记 。 (https://www.nature.com/articles/s41746-021-00415-6)
【Jeff Dean长文展望:2021年之后,机器学习领域的五大潜力趋势】鉴于这些新功能背后的数据具有潜在的敏感性 , 因此必须将它们默认设计为私有的 。 它们中的许多都在安卓私有计算核心内(Private Compute Core)运行 , 这是一个与操作系统其余部分隔离的开源安全环境 。 安卓确保私有计算核心中处理的数据不会在用户未采取操作的情况下共享给任何应用 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
