谷歌大神Jeff Dean领衔,万字展望5大AI趋势( 五 )



谷歌大神Jeff Dean领衔,万字展望5大AI趋势

文章图片
图11/25
图丨BigBird 稀疏注意模型由全局 tokens(用于处理输入序列的所有部分)、局部 tokens(用于处理输入序列的所有部分)和一组随机 tokens 组成 。 从理论上看 , 这可以解释为在 Watts-Strogatz 图上添加了一些全局 tokens 。
就计算效率而言 , 在模型中使用稀疏性显然是一种具有很高潜在收益的方法 , 而就在这个方向上进行尝试的研究想法而言 , 我们只是触及了表面 。
这些提高效率的方法中的每一种都可以结合在一起 , 这样 , 与美国平均使用 P100 GPUs 训练的基线 Transformer 模型相比 , 目前在高效数据中心训练的等效精度语言模型的能源效率提高了 100 倍 , 产生的 CO2e 排放量减少了 650 倍 。 这甚至还没有考虑到谷歌的碳中和(carbon neutral) , 100% 的可再生能源抵消 。
趋势3:机器学习正变得对个人和社区更加有益
随着 ML 和硅硬件(如 Pixel 6 上的 Google Tensor 处理器)的创新 , 许多新体验成为可能 , 移动设备能够更持续有效地感知上下文和环境 。 这些进步提高了设备的可访问性和易用性 , 同时计算能力也有提升 , 这对于移动摄影、实时翻译等流行功能至关重要 。 值得注意的是 , 最近的技术进步还为用户提供了更加个性化的体验 , 同时加强了隐私保护 。
人们比以往任何时候都依赖他们的手机摄像头来记录日常生活和创作灵感 。 机器学习在计算摄影中的巧妙应用提升了手机相机的功能 , 使它们更易于使用 , 产生了更高质量的图像 。 一些先进的技术 , 如改进的 HDR+ , 在弱光下的拍摄能力 , 更好的人像处理功能 , 及更大的包容性使得手机摄像可以更真实地反映拍摄对象 。 Google Photos 中基于机器学习的强大工具如 Magic Eraser 等还能进一步优化照片 。

谷歌大神Jeff Dean领衔,万字展望5大AI趋势

文章图片
图12/25

除了用手机进行创造外 , 许多人还依赖手机与他人实时跨语言沟通 , 例如在打电话时使用 Live Translate 和 Live Caption 。 由于自我监督学习(self-supervised learning)和有噪音的学生训练(noisy student training)等技术 , 语音识别准确率持续改善 。 对有口音的语音、嘈杂的语音或重叠语音等有明显的改善 。 在文本到语音合成的进步基础上 , 人们可以使用谷歌朗读技术 Read Aloud 在越来越多的平台上收听网页和文章 , 使获取信息更加便宜 , 跨越了模态和语言的障碍 。 通过稳定生成的即时翻译 , 谷歌翻译(Google Translate)的实时语音翻译水平显著改善 。 高质量的语音翻译在多语言交流时提供了更好的用户体验 。 在 Lyra 语音编解码器和 Soundstream 音频编解码器中 , 机器学习与传统编解码器方法相结合使语音、音乐和其他声音能够以低得多的比特率保真地传送 。

谷歌大神Jeff Dean领衔,万字展望5大AI趋势

文章图片
图13/25

智能文本选择(Smart Text Selection)等工具得到了改进 , 它可以自动选择电话号码或地址等信息 , 以便复制和粘贴 。 此外 , Screen Attention 可以防止手机屏幕变暗 , 凝视识别技术有所的改进 。 机器学习还让人们的生活更加安全 。 例如 ,Suspicious Message Alerts 对可能的网络钓鱼攻击提出预警 , Safer Routing 提出更加安全的替代路线 。
考虑到这些功能使用数据的敏感性 , 把它们默认设置为不共享是很重要的 。 以上提到的许多功能都在 Android的Private Compute Core 中运行 。 这是一个开源的、安全的环境 , 与操作系统的其余部分隔离开 。 Android 确保未经用户同意 , 不会将在 Private Compute Core 中的数据共享给任何应用程序 。 Android 还阻止 Private Compute Core 的任何功能直接访问网络 。 功能通过一小部分开源 API 与 Private Compute Services 进行通信 , 这样就能剔除身份敏感信息并使用联邦学习、联邦分析和私人信息检索等功能保护隐私 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。