上海人工智能实验室联合商汤等发布通用视觉技术体系“书生”( 二 )


阶梯式学习:七大模块构建全新技术路径
通用视觉技术体系“书生”(INTERN)由七大模块组成 , 包括通用视觉数据系统、通用视觉网络结构、通用视觉评测基准三个基础设施模块 , 以及区分上下游的四个训练阶段模块 。
上海人工智能实验室联合商汤等发布通用视觉技术体系“书生”
文章图片

通用视觉技术体系“书生”(INTERN)由七大模块组成 , 包括3个基础设施模块、4个训练阶段模块
书生作为中国古代读书人的经典形象 , 代表着一个通过不断学习、不断成长进而拥有各方面才能的人格化角色:从基础的知识技能学习开始 , 到对多种专业知识触类旁通 , 进而成长为拥有通用知识的通才 。 将全新的通用视觉技术体系命名为“书生” , 意在体现其如同书生一般的特质 , 可通过持续学习 , 举一反三 , 逐步实现通用视觉领域的融会贯通 , 最终实现灵活高效的模型部署 。
当前的AI系统开发模式下 , 一个AI模型往往只擅长处理一项任务 , 对于新场景、小数据、新任务的通用泛化能力有限 , 导致面对千变万化的任务需求时 , 须独立开发成千上万种AI模型 。 同时 , 研究人员每训练一个AI模型 , 都需构建标注数据集进行专项训练 , 并持续进行权重和参数优化 。 这种低效的学习训练方法 , 导致人力、时间和资源成本居高不下 , 无法实现高效的模型部署 。
“书生”的推出能够让业界以更低的成本获得拥有处理多种下游任务能力的AI模型 , 并以其强大的泛化能力支撑智慧城市、智慧医疗、自动驾驶等场景中大量小数据、零数据等样本缺失的细分和长尾场景需求 。
持续成长:“四阶段”提升通用泛化
在“书生”(INTERN)的四个训练阶段中 , 前三个阶段位于该技术链条的上游 , 在模型的表征通用性上发力;第四个阶段位于下游 , 可用于解决各种不同的下游任务 。
第一阶段 , 着力于培养“基础能力” , 即让其学到广泛的基础常识 , 为后续学习阶段打好基础;第二阶段 , 培养“专家能力” , 即多个专家模型各自学习某一领域的专业知识 , 让每一个专家模型高度掌握该领域技能 , 成为专家;第三阶段 , 培养“通用能力” , 随着多种能力的融会贯通 , “书生”在各个技能领域都展现优异水平 , 并具备快速学会新技能的能力 。
在循序渐进的前三个训练阶段模块 , “书生”在阶梯式的学习过程中具备了高度的通用性 。 当进化到第四阶段时 , 系统将具备“迁移能力” , 此时“书生”学到的通用知识可以应用在某一个特定领域的不同任务中 , 如智慧城市、智慧医疗、自动驾驶等 , 实现广泛赋能 。
上海人工智能实验室联合商汤等发布通用视觉技术体系“书生”
文章图片

“书生”(INTERN)技术体系可以让AI模型处理多样化的视觉任务
产学研协同:开源共创通用AI生态
作为AI技术的下一个重大里程碑 , 通用人工智能技术将带来颠覆性创新 , 实现这一目标需要学术界和产业界的紧密协作 。
上海人工智能实验室、商汤科技、港中文以及上海交大未来将依托通用视觉技术体系“书生”(INTERN) , 发挥产学研一体化优势 , 为学术研究提供平台支持 , 并全面赋能技术创新与产业应用 。
明年年初 , 基于“书生”的通用视觉开源生态OpenGVLab将正式开源 , 向学术界和产业界公开预训练模型、使用范式和数据库等 , 而全新创建的通用视觉评测基准也将同步开放 , 推动统一标准上的公平和准确评测 。
【上海人工智能实验室联合商汤等发布通用视觉技术体系“书生”】

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。