当然 , 最简单、最基础的算法 , 也就存在预测能力不够强的问题 。 形象地说 , 只用简单的线性回归 , 无法把特征值里隐含的信息全都榨取出来 , 所以预测效果不见得特别好 。 于是科学家和工程师们想了很多办法来压榨特征值里的信息 。 一种办法叫“特征工程”(feature engineering) , 说白了就是从已知的特征值推导出新的特征值 , 例如根据用户的手机型号、购物清单给用户打上“购买力强”或者“时尚潮人”的新标签 , 这就是一种简单的特征工程 。
另一种压榨特征值的办法是把起初的特征信息视为一“层”输入 , 然后用各种数学方法把输入层变换成新的信息节点 , 从而形成一个多层的“网络” 。 这个变换的过程可以重复进行 , 变换的层数越多 , 就说这个网络越“深”——这就是“深度学习”(deep learning)这个词的由来 。
尽管科学家经常用“神经元”、“神经网络”来类比这些数学变换的结果 , 但很多时候 , 经过这些变换得到的信息节点几乎没有现实世界中的含义 , 纯粹是一种数学工具的产物 。 所以业界有一种说法:深度学习就像炼金术(国内也称“炼丹”) , 把数据丢进神经网络 , 不知道什么原因就炼出结果了——如果结果不理想 , 就再加几层神经网络 。
我国《规定》的意义和疑虑
正因为业界对算法推荐、对深度学习技术的依赖 , 此次的《规定》才显得尤为重要 。 笔者认为 , 《规定》的公布 , 一方面迫使互联网企业约束自身行为 , 要用算法推荐技术为善 , 坚持主流价值导向、积极传播正能量 , 而不能制造信息茧房、诱导用户沉迷;另一方面迫使互联网企业加强内部能力建设 , 建立算法审核能力 , 主动选择并优化可被理解、可被审核的推荐算法 , 而不能搞唯技术论、过度依赖“炼金术”式的推荐算法 。
不过 , 毕竟此次的《规定》是一个开世界先河的新事物 , 在其实施过程中 , 笔者还是有一些具体的疑虑 。
首先 ,算法机制机理审核和科技伦理审查如何落实 , 对于监管机构可能是一个新的挑战 。 虽然《规定》要求“算法推荐服务提供者应当定期审核、评估、验证算法机制机理、模型、数据和应用结果” , 但这项要求是否落到实处 , 互联网企业是否真的进行了审核、评估和验证 , 算法结果是否合乎要求 , 其中可能有很大模糊空间 。 毕竟算法推荐审核不像违法不良信息审核 , 只要发现违法不良信息立即就能知道审核过程有问题 , 而算法推荐审核的效果是在长期、大范围的统计意义上表现出来的 , 如何核实审核是否确实落地 , 本身可能就是一个技术难题 。
其次 , 说明提供算法推荐服务的情况和允许用户关闭个性化推荐的选项 , 虽然各主要互联网企业已经实现了这些功能 ,但很难说是“以显著方式”告知用户 。 笔者作为IT专业人士 , 又是有意寻找 , 仍然花了一番功夫才找到几大App分别把“关闭算法推荐”的选项藏在哪里 。
当然从互联网企业的角度 , 他们肯定希望把这个功能藏在大多数用户找不到的地方 , 毕竟绝大多数用户找不着的功能就等于不存在的功能 。 那么从监管立场 , 为了避免“用户关闭算法推荐服务”的权利变成一句空话 , 是否应该考虑像GDPR那样 , 要求用户“明确许可”之后才能提供个性化推荐?
文章图片
GDPR要求网站必须获得用户明确许可后才能通过Cookie记录用户信息 , 迫使网站以真正显著的方式征求用户许可
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
