旧电影焕新：从“小应用”窥见CANN计算架构的“大能力”( 三 ) _影像

文章图片

如此复杂的处理流程自然包含复杂的计算过程，而这其中，只有背后支持的计算性能足够强力，才可以将人脸检测、人脸分割提取、对齐、人脸增强以及背景人脸融合这一大过程进行整合并加速，某种程度上，人脸区域的视觉增强表现出算法创新的重要路径——对计算平台性能的充分利用。
【旧电影焕新：从“小应用”窥见CANN计算架构的“大能力”】总结起来，得益于平台澎湃的算力和简单易用的特性，昇腾AI不仅支持各种前沿AI视频修复和增强算法的便捷部署和应用，例如减小视频噪声，增加流畅度，给黑白视频上色，增大图像清晰度等，也能对这些算法进行软件和硬件协同优化，提升处理的效率，高效地将低质量的视频原材料加工成精细流畅的成品。
这一AI视频修复和增强端到端全流程涵盖老视频去噪、人脸增强、插帧、超分等，基本实现了通过AI技术规模化生产4K/8K内容，使修复和增强时间从以天为单位缩短到以小时为单位。

文章图片

图历史影像素材修复和增强流程
昇腾多层次算法优化， CANN以基础软件创新释放平台算力
可以看到，上述AI视频增强技术在创新之外都强调了对计算性能的需求，既要保证处理效果，又要提升处理效率，对AI平台是重大的考验，而昇腾AI很好地完成了应有的支撑任务。
这背后，尤为关键的是昇腾全栈AI体系下的异构计算架构CANN ，作为基础软件创新成果， CANN高性能平台推动实现着一系列AI视频增强能力的落地。
CANN ，全称Compute Architecture for Neural Networks ，是昇腾处理器的异构计算架构，支持业界多种主流的AI框架，提供开放易用的ACL（Ascend Computing Language）编程接口、实现对网络模型进行图级和算子级的编译优化、自动调优等功能。用户不仅能在上层算法层面对性能进行优化，也可以通过CANN开发和优化算子。
要理解CANN的价值，要先从AI视频增强的原理谈起。
每个基于AI的视频修复和增强算法是由一个个小的计算单元组成的，专业术语为“算子” ，算子有不同的处理顺序，不同算子之间也可能存在依赖关系。
通俗地理解，其处理过程我们可以用厨师做菜来打个比方：
做菜工序可分为切菜、洗菜、调料准备、烧制、调味、摆盘等，不同的工序之间有依赖关系，摆盘前必须烧制，烧制前必须洗菜；或者可以并行操作，比如切菜洗菜的时候可以一并准备调料。经验丰富的厨师都能以最大化的效率完成一道菜的制作，并且通过对原材料、配料和调味料的充分理解、搭配和融合，提升菜品质量。昇腾AI就是这样包含了许多专门用AI来“做菜”的“厨师”的平台，上面的硬件就是一位位“厨师” ，异构计算架构CANN则是协调各位厨师的主厨。
这其中，而无论上文提到的去噪模型、超分辨率模型、人脸增强模型等，都包含到大量的计算过程，涉及到许多算子，整个计算复杂度非常大，如果平台能自动根据每个具体的算子情况进行调优，所谓积跬步致千里，就能显著提升各个算法的性能。
CANN对超分算法进行了自动调优，根据硬件特性和算子的输入来优化各算子的计算过程，就像让每个厨师清楚了解各种原材料的特性，并合理规划原材料的处理步骤，将材料的美味发挥到极致。
而值得一提的是，由于超分辨率算法中存在可变卷积，包含多个不同类型的小算子，需要在不同硬件上进行处理，中间会有硬件之间的数据和信息传递，这增加了处理的耗时，这就相当于是同一个工序由两个技术各有偏重的师傅一起交替处理，两者还需要配合和沟通，不如让一个技术更成熟更全面的师傅来进行处理，减小沟通成本，加快处理速度。

特别声明：本站内容均来自网友提供或互联网，仅供参考，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。