演讲:杨强
编辑:杜伟
可信联邦学习会是下一个技术趋势吗?杨强教授为我们展现未来全面的发展愿景 。
文章图片
3 月 23 日 , 机器之心 AI 科技年会在线上召开 。 在下午的人工智能论坛上 ,FATE 联邦学习开源社区技术指导委员会主席杨强教授做了主题为《可信联邦学习》的演讲 。 他带我们系统地回顾联邦学习的进展和挑战 , 并展望了该领域未来发展的一个重要阶段 —— 可信联邦学习 。
演讲视频回顾(点击「阅读原文」也可观看):
https://www.bilibili.com/video/BV1GY4y1q7ek?spm_id_from=333.999.0.0
机器之心对演讲内容做了不改变原意的整理 。
我今天讲的题目叫做「可信联邦学习」 。
首先回顾一下整个 AI 发展的阶段 。 我们看到 AI 现在有很大的发展 , 但是在理想和现实之间有很大的鸿沟 。 AI 现在主要的成就在于中心化的数据 , 样本足够多 , 质量足够好 , 特征也足够多 。 这样的情况下可以做出非常好的模型 , 像现在的预训练模型 。
但是 , 我们的真实世界数据是多元的 , 散落在各地 , 质量不同 , 属主不同 , 又带来不同的利益 。 数量的格式、质量、特征不同 , 随时间的变化大 。 理想化的 AI 没有考虑到的一个重要因素是 , 用户的隐私怎么解决 , 如何合规 , 监管和审计如何解决 , 等等 。
所以我们看到现在很大的成就 , 像大模型 , 我们预计在未来它们的发展趋势应该是来自很多分布式的小模型 。 这些模型有很多都是自下而上自发的 , 并且它们的合作和共享都是通过联邦的形式进行的 , 即联邦学习(Federated Learning) 。
隐私计算、联邦学习和安全多方计算之间的关系
接着来看隐私计算和联邦学习 , 这些概念对大家来说已经不陌生了 。 经过三四年的市场教育 , 大家已经清楚什么是隐私计算 , 什么是安全多方计算(MPC) , 什么是联邦学习 。 但是 , 在不同的场合也有很多疑问 。 那么 , 到底隐私计算是联邦学习的一部分还是联邦学习是隐私计算的一部分?安全多方计算是联邦学习的子集吗?它们之间的关系又是怎样的呢?
首先概念不要混淆 。 我们有两个层次的概念 , 第一个是作为目标来说 , 隐私计算、联邦学习和安全多方计算三者的目标是共同的 。 尤其对于人工智能、多方数据建模的要求来说 , 联邦学习是一个我们要去解决建立和使用模型的目标 。 但是 , 这些技术从不同领域又提供了很多工具包 , 就像我们造了很多不同的砖一样 , 包括安全多方计算、加密算法 , 硬件 , 分布式机器学习等 。 这些砖作为工具包服务于联邦学习和安全多方计算以及隐私计算的目标 。 这些工具包本身还不能为我们解决想要解决的任务 , 因为我们的任务和目标是盖一座大楼 , 中间要利用到这些砖 , 即工具包 。 所以有的时候 , 我们所说的隐私计算指的是目标;有的时候指的是这些工具包 。 对于安全多方计算和联邦学习也是如此 。
所以 , 我们说哪一个是哪一个的子集 , 哪一个是为哪一个服务 , 就要清楚我们说的是目标的概念 , 还是工具包的概念 。 我们可以看下图(右) 。 隐私计算作为目标来说 , 不同的技术路线都在试图解决它 。 但是 , 每个技术路线都有自己的特点 , 并有自己的工具包 。 这样来说 , 我们就可以解决谁到底是为谁服务的 。 我们一定要分清目标和工具包 , 工具包是为目标服务的 。
有的时候 , 我们说联邦学习的目标可以用安全多方计算工具来解决 , 有时候安全多方计算的目标可以用联邦学习和差分隐私来解决 。 这些并不矛盾 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
