在刚刚落幕的冰雪赛事中 , 百度智能云曦灵为央视新闻打造的AI手语主播正式上岗 , 她以流畅、专业的手语服务实时传递冰雪运动的激情 。 然而在日常生活中 , 听障人士想要方便地获取信息仍面临着众多困难 , 无障碍窗口稀缺的问题亟待解决 。
3月3日 , 百度智能云曦灵正式发布“AI手语平台” , 可实现分钟级生成手语合成视频、手语主播实时直播等能力 , 为手语服务普及的难题提出了科技新解法 。 同时百度智能云曦灵还发布了“AI手语平台一体机” , 可以通过规模化部署快速建立无障碍窗口 , 插电即用、操作简单 , 适用于医院、银行、车站等多种公共场合 , 缓解无障碍窗口短缺困境 。
百度集团副总裁吴甜表示 , 人工智能呈现融合创新和降低门槛的新特点 , 综合运用多技术的数字人带来新体验 , AI加持使数字人制作和运营成本与门槛降低 , AI手语平台将让更多听障人士享受科技带来的便利 。
文章图片
(百度集团副总裁吴甜)
AI手语平台+一体机 , 随时随地构建“无障碍窗口”
目前我国听力语言残疾人达到2780万以上 , 而专业的手语翻译不足1万人 , 巨大的需求缺口亟待补足 。
在国家发布的《无障碍环境建设“十四五”实施方案》中 , 明确提出要完善无障碍基本公共服务体系、加强信息无障碍服务深度应用 。 百度智能云曦灵此次发布的“AI手语平台”及“AI手语平台一体机” , 可以轻松在线上线下不同场景中快速实现手语翻译服务 , 助力无障碍环境的建设 。
针对线上场景 , “AI手语平台”具备“视频手语合成”、“直播手语合成”、“文本转手语”、“语音转手语”四大功能 , 只需几小时的部署 , 即可实现普通视频合成为手语视频、实时直播中增加手语画面、文字翻译为手语、语音实时翻译为手语等多种效果 。 AI手语平台可搭载在各类APP、网站、小程序中 , 让听障人士也能轻松实现线上社交、娱乐休闲、课程学习等各类需求 。
文章图片
对于诸如医院、银行、机场等线下场景 , 一体化产品的优势正在逐渐放大 。 百度智能云曦灵此次发布的全离线一体机V3以及端云结合一体机P3 , 搭载了“AI手语平台”的核心功能 , 可实现ASR语音识别、语音翻译、人像渲染等多功能 , 让“AI手语平台一体机”像手机、电脑一样可快速、批量的生产 , 并渗透到生活的各个角落 。
未来通过“AI手语平台一体机”即可将普通服务窗口直接转换为“无障碍窗口” , 听障人士在医院可轻松实现挂号、看诊、缴费、取药等全系列流程 , 在车站、机场可独立完成值机、托运、改签、中转 , 在法院、警局等特殊场景中也可对各类紧急情况进行实时平等的沟通 。
高可懂度手语表达的背后 , 是技术的创新与沉淀
和传统翻译相比 , 手语翻译过程更为复杂 , 主要在于手语翻译并非按照日常说话的顺序逐字翻译 , 而要根据语句意思进行语言精炼和语序调整 。 手语是真正的小语种 , 数据量难以支撑训练 , 各类场景声学环境复杂难部署 , 还需要唇语及表情的配合辅助理解 , 对AI手语平台的构建提出层层挑战 。
想实现高可懂度的AI手语能力要解决三大技术点:语音识别的清晰度、手语翻译的准确度、手语动作的流畅度 。 在经过开幕式、赛事播报等重重考验 , AI手语主播也印证着“AI手语平台”已成功解决这三大难题 , 以行业领先的全链路AI能力实现“听得清”、“翻得准”、“打得好”的手语服务 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
