金融机构如何解决数据稀缺困局?( 二 )


“隐私增强技术可以将大量以前无法共享的数据资产化进而使其可流通 , 具有创造新的商业模式的潜力 , 但是其成功落地需要对技术和业务都精通的复合型人才 。 ”《报告》称 。
毕马威的调研显示 , 隐私计算已成为金融科技企业关注的新兴技术 , 有47%的受访企业看好其未来在金融科技行业发挥积极作用 。
“索信达面向金融行业推出自主研发的企业级联邦学习解决方案 , 采用区块链技术 , 在满足数据隐私安全和监管要求的前提下 , 让人工智能系统更加高效准确地共同使用各自数据的机器学习框架 , 助力金融机构实现更高效、安全和精准的模型训练 。 ”索信达AI创新中心数据科学家邵俊博士表示 , 通过建立联盟链、区块链共识机制、设计合理的多方博弈机制、使用安全多方计算和同态加密技术等方式 , 解决传统联邦学习方案中存在的中心依赖、激励不足、单点欺诈、隐私泄露等痛点问题 。
除银行风控场景之外 , 联邦学习还可广泛应用于智能营销、贷款、信用卡、保险、计算机视觉、医疗大数据等场景 , 通过存量客户经营、高效触达高价值客户、唤醒沉睡客户等 , 达到对客户全生命周期管理以及价值深挖 。 邵俊认为 , 只要是在大数据分析的场景中 , 在机构需要外部更多的数据 , 而遭遇数据隐私保护导致的数据流动不畅的情况下 , 联邦学习就可以派上用场 , 未来 , 联邦学习将会越来越多进入到商业实践当中 。
然而 , 目前来看 , 隐私计算仍存在诸多挑战 。
《报告》显示 , 机构可能依赖技术提供方的框架和算子库 , 将可能导致第三方风险 。 尤为严重的是 , 设计一个高效安全的多方交互需要对业务有足够的了解 , 这是一般技术公司所不具备的 。 由于多方计算过程中没有原生信息 , 用户难以验证数据质量 , 这将导致数据定价困难 。 虽然一系列法律法规在规范大数据应用 , 但目前监管尚未定义数据隐私边界 , 新方法可能被用于处理法律不允许的活动 。
邵俊认为 , 联邦学习的应用落地还需要一个过程 , 无论从技术上还是行业生态上 , 都还有一些难度 。 一是设计激励机制 。 联邦系统是由多家机构共同协作完成 , 团队协作一定是在各方的利益都得到满足的时候才具备可行性 , 也就是根据每个参与方收益和贡献来进行分配利益 , 如何衡量每个参与方的贡献和收益?二是隐私保护的问题 。 即使传输一些模型中间数据比如梯度信息 , 而梯度信息的泄露还是会有原始数据被推导出来的风险 。 三是恶意攻击 。 如何保证联邦学习的每个参与方都是诚实的?不诚实的参与方又分为两种:一种是恶意的 , 一种是无恶意但是好奇的 。 恶意参与方可能会来对模型进行投毒 , 比如故意传输一些错误的数据来损害其他参与方的利益 , 而好奇的参与方不会去损害其他参与方的利益 , 但是会对所收集到的所有的交互数据进行分析 , 并试图推导其他各方的原始数据 。
另外 , 联邦学习还有一些其他比如数据传输效率的问题 。 模型训练会涉及到大量的运算 , 各方联合建模就会涉及到大量的数据进行交互的问题 。 比如像在梯度下降的时候 , 每一步的梯度迭代都会涉及到通信成本 。 所以通信效率也是联邦学习在落地过程中会遇到的挑战 。 此外 , 还有像机构与机构之间样本分布不均衡的问题等 。 “这需要业界不断加码投入 , 推动联邦学习技术的进步和在产业生态的落地 。 ”邵俊称 。
小数据趋势
“随着金融领域AI需求增加的倒逼 , AI算法将呈现多模态、低资源、小数据的发展趋势 。 ”《报告》显示 , AI自身能力持续进化 , 金融数据类型日趋丰富多样 , 同时金融领域的AI需求日益剧增 , 上述因素推动着工程化、多模化、低资源、小数据成为金融领域AI算法的大势所趋 。 通过多模态和低资源机器学习等关键核心技术 , 可以减少标注数据量 , 缩短AI研发周期 , 有效降低成本 , 提升用户体验 。

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。