运营负责人告诉时代周报采访人员 , 严格筛选出理念、价值观等大体统一的成员 , 即使行业疯狂拼抢AI人才 , 鉴黄团队仍保持基本稳定 。
鉴黄工作就像谍战剧
鉴黄是否真的需要一支如此精挑细选的博士团队?答案是肯定的 。
时代周报采访人员了解到 , 色情黑产高利高企 , 从业者达上百万人 , 同样是“高科技人才”“AI技术专家” 。 他们与鉴黄师的对抗实时发生 。
“我们有时候觉得很像谍战剧 , 双方斗智斗勇 , 从明显的色情内容对抗 , 到不易察觉的色情内容对抗 , 再到AI对抗 , 这是持续迭代的过程 。 ”陈宇介绍 。
文章图片
说是谍战 , 并不夸张 。 此前在各大社交平台频繁出现的“新茶”“喝茶”等内容 , 文字下方的配图 , 用显微镜都难以找到的一片茶叶上 , 是年轻女孩的自拍照 。 这是色情行业的引流暗语 。
一些所谓的“学生群”“培训群” , 某个美女头像成员说“网课有位置” 。 这是组织者向群员发送“我可以约”;“早安”是指早上有时间;“晚会”是说晚上有时间 。
陈宇他们时常在这些群卧底 。 “实时关注行业黑话变化 , 总得知道他们到底在说些什么 。 统一收集之后 , 这些就成了我们算法训练的素材 。 ”陈宇说 。
“模型天天都在学习和训练 , 关注最近出现的新词、黑话 。 ”陈宇说 。
文章图片
在此过程中 , 模型也需排除许多干扰 。 比如 , 医学中的宫颈糜烂图片、雕塑和油画中的裸露画面 。 不同场景下 , 模型界定的标准也需动态调整 。
搭建、运行如此一套复杂的AI鉴黄系统 , 真不是普通人干得了的 。 目前 , 即便这支全员博士的小分队 , 鉴黄准确率也很难达到100%:明显的色情内容可以达到99.99% , 轻微人工对抗内容为80% , 专业AI对抗在60%左右 。
“AI鉴黄技术在文字类和静态图像中的准确率较高 , 视频类次之 , 音频类较低 。 人工智能对软色情的鉴别还有短板 。 AI鉴黄可以大大减轻人工鉴黄师的工作量 , 但目前仍有误鉴率 。 ”9月18日 , 赛迪顾问人工智能产业研究中心高级分析师徐畅告诉时代周报采访人员 。
在陈宇看来 , 目前已经不再是单纯地音频鉴黄或者视频鉴黄 , 而是用多模态把信息聚合在一起 , 模拟人脑思维过程 , 准确率比单纯的音频或视频鉴别高得多 。
AI鉴黄还能扩展应用?
AI技术迅猛发展的今天 , 科技企业纷纷布局AI鉴黄 。
国外巨头的AI鉴黄走得更早 。 谷歌在2018年就推出免费AI工具软件 , 辅助人类鉴黄师对儿童性虐待内容(CSAM)的图像进行分类和鉴别 。 AI技术发展多年 , 如何落地真正改变人们生活 , 始终是科技企业的突破难点 , AI鉴黄正是一个不错的应用场景 。 学术研究需要真正落地去解决社会问题 , 而不仅是发表在期刊上的“空中楼阁” 。
文章图片
如今 , 腾讯AI鉴黄团队的技术成果主要运用于腾讯内外部的直播、短视频等公开场景 , 针对腾讯平台上的公开场景内容 , 结合用户举报信息进行鉴别 , 也会通过腾讯云对外输出 。
IDC全球人工智能支出指南预测 , 未来4年 , 全球人工智能相关支出将从2020年的501亿美元增至2024年的1100多亿美元 。
2020年 , 在新冠肺炎疫情的影响下 , 中国人工智能加速落地 , 助力抗疫与复工复产 。 AI技术在病毒基因检测、医疗影像分析等各领域都得到推广普及 。 艾媒咨询数据显示 , 2020年中国人工智能行业核心产业市场规模超过1500亿元 , 预计在2025年超过4000亿元 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
