在猿辅导搞技术是一种什么体验?

猿辅导作为一家教育公司 , 为什么会出现在语音合成技术的国际赛场上?
其实缘于一个偶然的契机 。
当时 , 这次的参赛队员杨明祺将随手刷到的大赛信息转发到语音组群里 。 就在研发同学们的日常吹水中 , 他们突然想到 , 猿辅导在这方面已有技术积累 , 何不趁着这个比赛跟其他队伍切磋交流一下 , 看看在统一任务下别人有什么不一样的想法可以借鉴学习 。
这种保持对前沿技术关注、主动学习的操作 , 倒并不是临时起意 , 而是整个技术部门再正常不过的日常 。
从他们坚持已久的一个习惯中也可见一斑——
Paper reading , 是猿辅导AI Lab自2014年成立以来一直坚持至今的一项活动 。
7年来 , 团队每周都会安排一位技术同学在组会时分享一篇前沿技术论文 , 并与其他同事深入交流讨论 。
在猿辅导搞技术是一种什么体验?
文章图片

起初 , 整个实验室的都要一起参加这样的阅读会 。 后来随着规模的不断扩大 , 改为下设5个实验室分别举办 , 自己实验室的同学当然必须参加 , 其他实验室的人也可以根据兴趣参与进来 。
不同技术之间的碰撞 , 也成为了猿辅导独有的技术方法论 。
语音实验室语音合成组的杨明祺 , 就分享了一段经历 。
在听到降噪小组分享有关提高信噪比的最新技术时 , 语音合成组就想到 , 是否能将这样的技术应用到TTS上来 。 因为平时采集的训练样本 , 录制环境不一 , 音质无法保证 , 而引入相关技术 , 就能从数据层面来提升最终合成语音的质量 。
除此之外 , 作为一家在线教育公司 , 猿辅导有更丰富、更具体的落地场景 , 因此也就要比一般的技术公司更看重技术落地 。
低延时直播 , 就是这样一个例子 。
市面上通用的直播技术 , 可能有1-3秒、甚至更长的延时 , 对于直播带货这个场景下影响不大 , 但要是在教育教学上 , 学生和老师有着很强的互动需求 , 几秒的延时就会影响教学体验 。
就比如 , 老师在课上提问 , 学生正在思考的时候 , 老师就已经给出答案讲下一个问题了 。
因此 , 就需要将延时技术从3秒降到0.3秒 , 来维持课堂效果 。
语音组马楠也表示 ,
很多时候 , 一线的教学老师提出需求 , 研发人员就要想办法结合最先进的技术来满足 。 所以平时看到一些新的论文、技术方案 , 也会想着能具体落到什么场景 , 能否配合一线老师教学 。
也正因为看重落地的本质 , 他们随时保持着Ready的状态 。
什么时候有新的需求 , 就想着法儿的用技术去满足 , 也因此团队成员们练就了能快速适应业务转型的本领 。
马楠说 , 他们这个语音合成组 , 大多本来不是这个专业的 , 比如有的成员过去是做搜索的 , 可以说都是逐渐摸索学习过来的 。
现在他们从一个想法到Demo , 只需要半个月到1个月的时间就可以达成 。
因此 , 也不同于其他技术团队的成就感 , 他们成就感的来源 , 更多是一线老师的反馈 。
“比公开服务更好用” , 就是他们接收到的最好的嘉奖 。
隐藏在教育背后的技术实力
事实上 , 虽然外界对猿辅导的认知更多地聚焦在“教育”上 , 但猿辅导从成立之初 , 就是一家把“技术”视作核心竞争力的公司 。
在2014年 , 猿辅导就成立了AI Lab , 是在线教育行业内首个成立AI研究院的企业 。
从业务上看 , 猿辅导旗下有:拍一下就能秒出解题思路的小猿搜题 , 用AI帮助老师、家长批改作业的小猿口算 , 利用AI打造智能学习模型的斑马AI课……

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。