语音和多模态人机交互会是以机器人为代表的智能硬件的必备特征, 实践中首先要克服的是声学环境的复杂性 。 在声学前端核心技术上, 深挖信号处理的在线自适应能力, 以及经典信号处理与任务模型的联合优化是我们的技术特色, 也因此在高噪声、高性价比等实际业务场景都创造了多项业内第一 。 声学模组和芯片化也是克服场景碎片化的有效手段, 也因此快速合作落地了一批智能硬件产品, 赢得了客户的口碑 , 为端侧计算能力的平台化, 探索了有生命力的路径 。
2021年以来 , 机器人赛道受到资本热捧 。 仅前10个月拿到融资的机器人项目就有299个 , 其中253个集中在C轮及以前 , 79个项目的融资额在亿元人民币以上 。
天眼查数据还显示 , 今年新增的机器人相关企业就超过10万家 。 截至目前 , 我国有超过32万家机器人相关企业(企业名称或经营范围包含机器人) 。 在地域上 , 广东省机器人相关企业最多 , 有超过7万家 , 占比达22.02% 。 是第二名江苏的近2倍 。
所以在这个产业和资本双重背景下 , 36氪于11月25日在深圳举办了超前体验·机器人峰会 。 此次峰会邀请了众多投资人、科学家、学者、优秀创业者以及相关从业者 , 共同探讨行业新趋势 , 以及在新环境下如何让技术走进大众生活 。 嘉宾包括中国工程院院士谭建荣、达晨财智业务合伙人任俊熙、蓝驰创投董事总经理曹巍、阿里巴巴达摩院研究员付强、高仙机器人创始人兼CEO程昊天、大族机器人CEO王光能、未来机器人创始人李陆洋、云迹科技执行总裁兼CTO林小俊等多位嘉宾 。
“语音和多模态的人机交互会是以机器人为代表的智能硬件必备特征 , 实践中首先要克服的是声学的复杂性 。 ”阿里达摩院拥有应对不同声学环境下的思路和技术链条 。

文章插图
【阿里达摩院:以语音为代表的人机交互或许是未来硬件和机器人的标配 | 2021WISE元宇宙·机器人峰会】以下是阿里达摩院的付强先生现场演讲《复杂声学环境下的语音交互》(经编辑):
其实在无论是智能硬件还是特指机器人这个行业 , 以语音为代表的人机交互是一个比较重要的特征 。 刚才我听达晨财智的任总也提到无论是VR、AR、机器人还是别的一些行业 , 语音交互和知识图谱的应用 , 都是一个必选项 。 但是这种人机交互 , 特别是语音交互的技术在应用上的问题在哪里?首先是不同的场景会遇到不同的声学问题,包括背景噪声、混响等声学环境特性的差异 。
模组化是应对各种碎片场景的一个常用的技术手段 。 这是什么意思呢?就是说我们希望能够通过对声学器件、操作系统、声频算法和交互应用调度, 包括连接协议等做成从软件到硬件的一体化封装 , 去应对不同的场景里的离散性的问题 , 使得方案更加得平台化 , 与声学和音频相关的技术也能被沉淀 。 另一方面 , 就是提升跟客户对接的效率 , 包括我们也提供二次编程能力 。
刚才我们讲了应对不同的声学场景下的思路和技术栈 , 接下来介绍阿里达摩院的整个语音AI技术栈 。 一个标准的语音交互链路 , 端上首先是有信号处理 , 然后是语音唤醒,本地识别等 , 还有服务智能硬件所不可缺少的声学设计配套 。 云端的语音服务主要就是识别、合成、对话管理 , 还有声纹相关的技术栈等 , 这些构成了一个完整的从端到云的技术链 。
下面逐一介绍一下整个技术链条上我们一些关键技术的突破 , 主要是近期比较着重打造的东西 。
- 西藏美丽乡村携程产业学院正式揭牌
- 长沙抽脂多少钱?长沙抽脂多少钱?哪家医院好?
- 淘宝登录阿里妈妈 阿里妈妈引力魔方是什么?入口在哪?京东小魔方入口
- 字节跳动,投了一位前阿里女员工
- 顺德龙江职业技术学院怎么样 佛山龙江科技职业学院怎么样?
- 美容院或者按摩院的经络理疗有用吗?
- 医院招聘一名护士需要什么 医院招聘护士的时候对身高有什么要求?
- 去医院做一次全面的体检需要多少钱?必做的检查有哪些?
- 花旗维持阿里健康买入评级目标价20港元
- 前阿里副总裁墙辉创办的“来未来科技”获2亿元A轮融资
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
