隐私计算崛起还有多远?( 四 )
徐敏告诉采访人员 , 从应用层面而言 , 目前隐私计算重点对接的数据来源包括三个:银行数据、运营商数据、电网数据 。 形成这一结构的原因在于 , 这类数据规范性较强 , 标准化程度较高 , 合规运用的效率较高 。
“运营商数据很丰富 , 用户通话信息、上网行为信息和位置信息等 , 运营商都有 , 这些数据对于评估分配一个人的资信情况很有价值 , 这些数据不能对外提供 , 但是通过隐私计算的方式 , 可以综合这些因素 , 再和银行的数据一起形成评级 , 来标定一个主体的风险等级 。 ”徐敏说 。
此外 , 电网机构也是重要的数据来源 。 一位隐私计算公司的技术人员告诉采访人员 , 企业用电负荷、缴纳电费等电网数据 , 可以反映企业的经营状况 , 但只有这一数据的价值非常有限 。 如果结合工商登记信息、司法履约信息、对外投资信息等外部数据 , 构建科学的算法模型 , 就可以形成企业的评级或征信信息 , 等于挖掘出了更多的数据价值 。
这个思路已经用于实践 , 同盾科技的隐私计算服务中所使用的数据源 , 便包括部分电网数据 。 李晓林告诉采访人员 , 他们采用的数据处理方式叫作知识联邦模式 , 这种模式不同于使用本地的海量数据进行机器学习、模型训练 , 而是利用多方的部分数据来提炼知识达到训练机器学习的作用 , 从而撬动更大的数据资源来共创和共享知识 。
据李晓林介绍 , 知识联邦模式是一个多层级的模型系统 。 可以先在内网层面操作 , 比如在一定范围内交换不同的电网数据 , 把这部分数据加密处理 , 进行模型训练 , 用于训练的数据不出“本地” , 在模型的科学性和应用性达标后 , 用于训练的数据将被清除 , 而这个模型将用于电网数据和其他外部数据融合 。 “这种模式更安全 , 且不能反推出原始数据 , 已经被用于金融反欺诈、企业融资、营销、疫情预报等场景 。 ”他说 。
而拥有数据资源或数据使用权的一方 , 也有开发数据价值的诉求 , 换言之 , 就是他们也需要和外部数据互联互通 , 推动多数据资源整合 。 一位运营商人士表示 , 他们有专门的部门和团队开展合规数据经营业务 。 现在 , 隐私计算的服务商 , 也是他们的客户 。 在与客户的合作中 , 运营商遵循两个原则:其一 , 不外泄个人信息 , 具体包括电话号码、APP装机种类、开机时长等;其二 , 相关信息不能对应个人姓名、电话 , 且信息不能出“本地” 。
但是 , 他拒绝向采访人员透露这种合作具体的费用标准 。
采访人员了解到 , 国家电网也成立了商用大数据、征信公司 , 拓展电力大数据的应用场景 , 打破各行业间的数据孤岛 , 推动数字经济融合发展 , 隐私计算将发挥更大作用 。
“隐私计算有助于将数据的所有权和使用权分离 , 并创造商业价值 , 这在数据成为生产要素后 , 有着非常重大的现实意义和作用 。 ”徐敏说 。
赛道有多大?
牵涉到算法、模型、数据这些颇具“技术含量”的语汇 , 隐私计算给人“高深莫测”的感觉 , 技术是隐私计算立命根本 , 但这个赛道前景如何?商业化道路能走多远?应用空间也是不可忽视的问题 。
就商业模式 , 徐敏告诉采访人员 , 隐私计算一般有两种模式:一种是收取隐私计算系统搭建的费用 , 这种模式下 , 收入是以“单”计算的 , 根据客户需求的不同 , 有不同的报价组合;另一种是收取运营的费用 , 即搭建系统完成后 , 按照客户使用查询的次数收费 。 这部分费用先由隐私计算服务供应商向客户收取 , 而后隐私计算服务的供应商 , 再向数据方支付使用数据的费用 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
