- ncnn的系统架构图
- ncnn的数据结构及支持框架
- ncnn的网络表示
- ncnn网络优化 , 量化 , 及各平台的优化策略
本节课将讲解tnn的系统架构图 , 数据结构 , 支持的框架 , 网络的表示 , 网络优化 , 量化 , 以及各平台的优化策略 。
课程提纲:
- tnn的系统架构图
- tnn的数据结构及支持框架
- tnn的网络表示
- tnn网络优化 , 量化 , 及各平台的优化策略
本节课将讲解mnn的系统架构图 , 数据结构 , 支持的框架 , 网络的表示 , 网络优化 , 量化 , 以及各平台的优化策略 。
课程提纲:
- mnn的系统架构图
- mnn的数据结构及支持框架
- mnn的网络表示
- mnn网络优化 , 量化 , 及各平台的优化策略
本节课将讲解cpu中的指令集优化 , simd、avx、sse方法 , 及tvm中对于cpu上神经网络加速的位置 。
课程提纲:
- cpu中的指令集优化:simd , avx , sse方法
- tvm中对于cpu上神经网络加速的位置
本节课将讲解arm中的neon优化 , 及ncnn , tnn和mnn的实现 , 并结合实际例子来看具体的加速效果 。
课程提纲:
- arm中的neon优化
- ncnn , tnn和mnn实现的讲解
- 具体加速效果的实际案例
本节课将讲解卷积计算的优化算法 , 包括winograd等 。
第十二周:神经网络加速库
本节课将讲解openblas库的优化 , nnpack/qnnpack的优化 , 及lowpgemm。
课程提纲:
- o penblas库的优化
- nnpack/qnnpack的优化
- lowpgemm
本节课将讲解gpu与cpu计算加速的区别 , 英伟达gpu的原生cuda加速方法 , 及推理侧tensorrt的使用 。
课程提纲:
- gpu与cpu计算加速的区别
- 英伟达 gpu的原生cuda加速方法
- 推理侧tensorrt的使用
本节课将讲解通用加速库cublas , vulkan , opencl的使用 。
课程提纲:
- 通用加速库cublas的使用
- Vulkan的使用
- opencl的使用
本节课将讲解dsp , fpga , npu的专用加速计算。
课程提纲:
- dsp计算加速
- fpga计算加速
- npu专用加速计算
本节课将以嘉楠科技的k210为例 , 实现一个人脸检测案例 。
课程提纲:
- 嘉楠科技k210芯片介绍
- nncase人脸检测案例
05
授课方式
- 基础知识讲解
- 前沿论文解读
- 论文代码复现
- 该知识内容的实际应用
- 该知识的项目实战
- 该方向的知识延伸及未来趋势讲解
适合人群
大学生
- 编程及深度学习基础良好 , 为了想进入AI芯片行业发展
- 想进入AI芯片行业的算法或IT工程师
- 想通过掌握硬件技术 , 拓宽未来职业路径的AI算法工程师
- 掌握python 、C++开发 , 及深度学习的基础知识 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
