一群年轻人教“AI”学手语,目标是让千万聋人被“听见”( 六 )


闫思伊在天津理工大学计算机学院读研二 , 是手语实时翻译项目团队的健听人成员 , 主要负责“后台”工作——构建手语识别算法框架模型 。 如果沿用教孩子学说话的比喻 , 学前阶段完成了反复加深印象的步骤 , 一上小学 , 孩子就要开始学习拼音、语法 , 学会按照教材上总结的规律 , 把学过、听过的那些单词组成句子和课文 , 写在作业本和卷子上——闫思伊就是编“教材” , 帮AI这位“同学”总结手语规律的“老师”之一 。
“这部分技术要求更高的工作 , 主要由我们学校计算机学院的师生来完成 。 ”袁甜甜说 , 给人工智能“编教材”的过程很艰辛 。 在手语识别、翻译领域 , 可借鉴的经验太少 , 同行的进度也都差不多 。 项目团队参考了德国天气预报自然手语翻译系统的算法 , 也通过各种渠道寻找类似系统在网络上公开发布的源代码 , 然后就是一遍遍地尝试和修正 。
闫思伊他们每天早上8点半就扎进机房 , 等意识到天黑该回宿舍 , 再看表已经是晚上10点了 。 “我觉得我们的项目有意义啊 , 就想快点出成果 , 能落地的成果 。 ”她说自己是个典型的理工女 , 就喜欢计算机 , 导师让周一到周五做项目 , 她周六日也忍不住去跑代码 。 就这样一点点摸索 , 一点点“紧螺丝” , 第一次跑通代码的那天早上 , 计算机“同学”在它的人类老师们面前 , 写下了一份不算完美 , 但成绩合格的手语翻译试卷 。
今年5月 , 王建源、乌力杰带着研究成果上了世界智能大会;10月 , 他俩又和聋人工学院其他几位同学组成创业团队 , 代表天津理工大学 , 拿下了第七届中国国际“互联网+”大学生创新创业大赛总决赛高教主赛道的金奖 。
他们的“夺金”项目叫“鲸可语” , 全称“鲸可语多模态连续手语自动标注识别系统” 。 自动标注识别就是手语翻译的前期步骤 , 而“鲸可语”正是依托“手语实时翻译系统”而生的——他们把两年来“教机器学手语”的经验转化成自己的科创项目 , 亲手为他们想象中那座“聋健融合之桥”建起了“桥基” 。
决赛夺金的那天 , 袁甜甜在朋友圈给她的学生们一个个点赞 。 作为“鲸可语”的指导老师 , 她很喜欢这个温柔又有力的名称 。
鲸可语 , 来源于“52赫兹鲸”的故事 , 在海洋中 , 这只因为叫声频率与众不同而无法与同类交流的鲸鱼 , 被称为“最孤独的存在” 。 但事实上 , 如果你能破解52赫兹的密码 , 就会发现它并非一座孤岛 , 它也会歌唱 , 也有自己的语言 。 王建源觉得这只鲸鱼很像听障群体 , “沉寂在人海中 , 无时无刻不在渴望着与外界沟通 , 渴求着回应 。 ”
几个听障年轻人给“鲸可语”设计的标志 , 像一只蓝色海洋中漂浮的白色鲸鱼 , 也像人们把拇指和食指搭在一起“比心”时的手形 。 “我们建手语语料库的时候 , 就是要把手语的动作手型概括为像这样简洁的线条 , 正是这一个个线条 , 支撑起了‘鲸可语’系统 , 实现了对手语的识别 。 ”王建源说 。
而他们开发手语识别系统的初心 , 就是帮助那只“52赫兹鲸” , 获得言语的能力和“被听懂”的权利……(参与采写:吴泽运)

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。