全年无休、业务出色、绕口令都通通接得住!
近日 , 一则朱广权“考验”手语主播的视频登上热搜 , 视频里朱广权秉承着“地球不爆炸 , 我们不放假”的敬业精神 , 以超高速顺口溜为手语主播连连抛出挑战 , 而“颜值、业务双在线”的手语主播也以流畅、精准的动作完美接住挑战 , 让朱广权都忍不住夸赞“反应很快、精彩” 。
文章图片
▲AI 手语主播
其实 , 广权老师的这位新搭档并不是真人 , 而是由百度智能云打造的首个 AI 手语主播 。 在即将开启的冰雪盛会中 , 她将为以 AI 为核 , 为中国2780万的听障人士搭起观赛的桥梁 , 提供24小时不间断的手语服务 , 实时传递精彩纷呈的比赛资讯 。
那么 , 手语数字人与普通数字人有什么区别?制作难点在哪?未来有哪些发展空间?
想了解手语数字人
就要先了解手语
简单来说 , 可以将“手语”理解为一种“小语种” , 与所有的语言一样 , 想让更广泛的人群理解这种“语种”并且互相沟通 , 首先要构建一套通用的“翻译”法则 。
与方言的情况类似 , 不同地域的手语在表达方式上存在差异 。 以“钱”这个词举例 , 有的地方手语是做捻钞票的动作 , 有的地方则是用拇指、食指捏成小圆圈 。 这就需要为手语构建如普通话一般的通用沟通标准 。
同时 , 手语会在我们日常说话的基础上 , 进行语序的调整与语言的精简 , 比如我们说“我想回家” , 手语会按照“家”、“回”、“我想”的顺序依次用三个手势进行表达 。 我们说“3号我要冻哭东北内蒙古地区” , 在手语中则会被精简成“3号东北内蒙古” 。
手语翻译也并非简单的语言翻译 , 动作、表情、口型三大环节一个都不能少 。 当一个手势代表好几个意思时 , 就需要表情与口型的充分配合 。
举个例子:“吃饭了吗?” , 这句话里“吃饭”有具体的手势动作 , 但“了么”如何表示?就需要配合“表情”:眼睛睁大 , 眉头皱一下 。
这些例子也充分证明着唯有真正懂得手语 , 才能为数字人构建通用“翻译”法则 , 打造出听障人士用得上、用得好、用得方便的“真·手语数字人” 。
手语数字人现状:
玩家很多 , 但缺少实干家
有了字幕 , 为什么还需要手语来传递信息?
在与手语老师沟通的过程中 , 百度智能云团队了解到 , 由于听觉与学习文字的关联性 , 导致残障人士对文字的阅读理解存在一定障碍 , 相比文字更能认清日常使用的手语 , 且手语看起来更加亲切 , 屏幕上的一角对他们来说就是一个“平等享受资讯的世界” 。
遗憾的是 , 目前行业里很多看起来“眼花缭乱”、“动作智能”的手语数字人 , 听障人士实际上是看不懂的 。
一个原因是 , 很多厂商为了追求效率直接采用“手势汉语语料” , 即忽略手语的语序调整、语言精简等特殊性 , 直接生硬地按照说话顺序 , 将每个词的手势链接 , 实则是一种忽视听障人士沟通需求的“半吊子手语” 。
更不合理的是 , 有些厂商为了凸显手势的流畅度 , 并未对手势与手势之间的链接进行针对性训练 , 只是对数字人的动作一味加速 , 生硬地将动作连接起来 , “鬼畜”的手语让听障人群不得不连连摇头 。
由此可见 , 想要打造一个高质量手语数字人 , 绝非原有数字人的基础上简单调整 , 做做加法 , 需要同时具备语音技术、视觉技术、自然语言处理等技术能力 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
