AI手语翻译的主要困难在于 , 手语也有自己的“语法” , 语序也并不一定与汉语相同 , 且手语也存在“方言” , 即便是真人手语翻译师也难以保障百分百的可懂度 。 因此AI手语虚拟主播本质上仍是一个即时翻译功能 。
由百度开发的AI手语虚拟主播由其数字人平台曦灵打造 , 主要是通过语音识别、自然语言理解等人工智能技术构建手语翻译引擎 , 再通过专为手语优化的自然动作引擎奖授予实时演绎为数字人的表情动作 。 而“聆语”则由腾讯云小微联合PCG AI等技术团队共同打造 , 通过整合多模态交互技术、3D数字人建模、机器翻译、语音识别和自然语言理解等技术优化手语翻译 。
相关报道显示 , 百度通过百度智能云构建手语翻译引擎 , 可懂度达到85%以上 , 聆语词汇和语句覆盖量超过160万 , 手语翻译的可懂度可达90% , 基本可以满足电视直播手语翻译的需要 。
而在手语翻译之外 , 另一位关键虚拟人 , 天气主持人冯小殊背后 , 则是微软小冰在虚拟数字人技术上的积累 。
据了解 , 微软小冰所提供的冯小殊仅用了1周的时间就完成了对冯殊本人的学习 , 这背后是微软小冰通过深度神经网络渲染技术及小样本学习技术 。 用少量样本就令冯小殊的面容、表情、肢体动作的整体自然度就达到了与真人相似的程度 , 再经过语音、嘴型、人脸渲染专家模型训练 , 学习了冯殊本人的嘴部动作、眼部及脸部肌肉之间的协同关系 。

文章图片
图8/8
冯小殊播报天气 来源/中国天气
而作为冬奥会备受瞩目的运动员 , 谷爱凌的数字分身Meet GU则是则应用了3D人脸关键点位置精确修正、眼眶眼球自动适配、任意姿态人脸配准等核心技术 , 让3D人脸拟合精度达亚毫米量级 。
但与微软小冰的冯小殊不同 , Meet GU在冬奥直播间里的做报道并非其主要任务 , 从Meet GU自诞生到现在的主要活动中不难发现 , 代替谷爱凌进行冰雪运动推广才是 。
自Meet GU在“中国移动5G冰雪之队”发布会上首次亮相以来 , Meet GU先后受邀担任首档元宇宙交互冰雪音频节目的DJ , 以及成为热爱REAI的“探秘伙伴”共同为冬奥做宣传 。
Meet GU的出现令谷爱凌可以在不影响日常训练生活的情况下完成上述工作 。 而除此之外 , 在更多虚拟主播的应用场景中 , 这种“替代”关系也随处可见 。
比如AI手语主持人替代了人类手语主持人的工作 , 阿里的冬冬替代了带货主播的工作 , 小诤替代了体育采访人员的工作 。
而观察这些虚拟人的应用场景我们也会不难发现 , 虽然自2021年以来 , 各种虚拟人已经层出不穷 , 但真正在这种国际盛会上展示应用的 , 除了像洛天依这样的元老级虚拟偶像之外 , 娱乐型、表演型的公司出镜却并不多 。 更多的还是以技术驱动 , 并最终在一定程度上替代人类工作的服务型虚拟数字人 。
这种趋势 , 反映在虚拟人的发展上也是如此 。
比如 , 虽然最先兴起的是以虚拟偶像为主的表演型虚拟人 , 但在实际应用当中 , 虚拟客服这样的to B场景反倒后来居上 。 2021年 , 万科更是将最佳新人奖颁给了工作效率比人类高千百倍的虚拟人员工崔筱盼 。
显然 , 在未来很长一段时间 , 随着虚拟人技术的普及 , 这种对人类简单重复劳动的“替代”必然还将继续 。
当然 , 这其实也从另一个角度反应了未来虚拟数字人发展的广阔前景 。 据虚拟数字人深度产业报告的预测 , 2021年虚拟人的市场规模约2000亿元 , 而至2030年 , 我国虚拟人整体市场规模将达到2700亿 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
