项目对应第几周的课程:5~8周
▌项目3
项目名称:通用芯片加速技术
项目内容描述:cpu , arm对应的指令集级别的加速 , 编译器中具体的优化策略 , simd , avx , sse , openblas , neon和cpu中对于卷积的运算加速方案 , cpu上的具体实例 , arm上的具体实例 , 环境配置 , 神经网络的例子 , 加速方案的组合和实际效果 。
项目使用的算法:simd , avs , sse , blas , winograd
项目使用的工具:nnpack , qnnpack , lowpgemm , tvm , ncnn
项目预期结果:学员深入掌握cpu , arm等芯片的神经网络加速技术 , 并且通过一个例子来看具体的加速效果。
项目对应第几周的课程:9~12周
▌项目4
项目名称:专用芯片加速技术
项目内容描述:gpu和k210 npu及各自神经网络编译器中的加速优化技术 , gpu上的cuda加速的方法 , cublas , opencl , vulkan的开发例子 , nncase上编译一个网络 , k210开发板环境配置及人脸检测模型的部署
项目使用的算法:人脸检测
项目使用的工具(编程语言、工具、技术等):Python , C/C++ , opencl , vulkan , nncase
项目预期结果:学员可以掌握gpu及npu上神经网络的编译加速 , 并且通过一个具体的例子来完成人脸检测模型在k210芯片上的部署。
项目对应第几周的课程:13~16周
感兴趣的请添加咨询顾问
04
详细内容介绍
第一周:轻量化网络结构设计
【2022年薪百万赛道:高性能神经网络与AI芯片应用!】本节课将讲解网络参数量、浮点运算数等模型评价指标、工具 , 以及分类网络 ,检测网络 , 分割网络的轻量化设计 。
课程提纲:
- 轻量化网络设计背景介绍
- 网络的计算量和内存分析工具
- 主干网络的轻量化
- 检测网络的轻量化
- 分割网络的轻量化
- 典型网络的设计思路
本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法 。
课程提纲:
- 知识蒸馏方法介绍
- 知识蒸馏原理和步骤介绍
- 知识蒸馏训练方法缩减网络的实际分类网络演示
- 低秩分解原理
- 低秩分解加速计算在神经网络推理中的应用
本节课将讲解网络稀疏性原理 , 网络剪枝原则及剪枝的常见方法 。
课程提纲:
- 网络剪枝的原理
- 常用的剪枝策略
- 神经网络框架中的剪枝功能介绍
- 剪枝的实际使用
本节课将讲解网络的低比特化 , 以及在AI芯片中的计算 , 实现网络量化的离线和在线感知的量化方法 。
课程提纲:
- 网络量化的技术发展
- 不同离线量化算法的实现原理
- 神经网络框架中在线感知量化算法的原理及实现
- 实际案例
本节课将讲解tvm、ncnn、tnn、mnn的简要对比 , tvm relay和网络转换 , 网络的编译优化和推理加速 。
课程提纲:
- tvm、ncnn、tnn、mnn的简要对比
- tvm relay和网络转换
- 网络的编译优化和推理加速
- tvm的实际案例
本节课将讲解ncnn的系统架构图 , 数据结构 , 支持的框架 , 网络的表示 , 网络优化 , 量化 , 以及各平台的优化策略。
课程提纲:
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
