2022年薪百万赛道:高性能神经网络与AI芯片应用!( 三 )


  • ncnn的系统架构图
  • ncnn的数据结构及支持框架
  • ncnn的网络表示
  • ncnn网络优化 , 量化 , 及各平台的优化策略
第七周:tnn
本节课将讲解tnn的系统架构图 , 数据结构 , 支持的框架 , 网络的表示 , 网络优化 , 量化 , 以及各平台的优化策略 。
课程提纲:
  • tnn的系统架构图
  • tnn的数据结构及支持框架
  • tnn的网络表示
  • tnn网络优化 , 量化 , 及各平台的优化策略
第八周:mnn
本节课将讲解mnn的系统架构图 , 数据结构 , 支持的框架 , 网络的表示 , 网络优化 , 量化 , 以及各平台的优化策略 。
课程提纲:
  • mnn的系统架构图
  • mnn的数据结构及支持框架
  • mnn的网络表示
  • mnn网络优化 , 量化 , 及各平台的优化策略
第九周:cpu中的指令集优化
本节课将讲解cpu中的指令集优化 , simd、avx、sse方法 , 及tvm中对于cpu上神经网络加速的位置 。
课程提纲:
  • cpu中的指令集优化:simd , avx , sse方法
  • tvm中对于cpu上神经网络加速的位置
第十周:arm中的神经网络加速
本节课将讲解arm中的neon优化 , 及ncnn , tnn和mnn的实现 , 并结合实际例子来看具体的加速效果 。
课程提纲:
  • arm中的neon优化
  • ncnn , tnn和mnn实现的讲解
  • 具体加速效果的实际案例
第十一周:卷积计算的优化算法
本节课将讲解卷积计算的优化算法 , 包括winograd等 。
第十二周:神经网络加速库
本节课将讲解openblas库的优化 , nnpack/qnnpack的优化 , 及lowpgemm。
课程提纲:
  • o penblas库的优化
  • nnpack/qnnpack的优化
  • lowpgemm
第十三周:gpu上神经网络的运行和加速
本节课将讲解gpu与cpu计算加速的区别 , 英伟达gpu的原生cuda加速方法 , 及推理侧tensorrt的使用 。
课程提纲:
  • gpu与cpu计算加速的区别
  • 英伟达 gpu的原生cuda加速方法
  • 推理侧tensorrt的使用
第十四周:gpu加速通用加速库
本节课将讲解通用加速库cublas , vulkan , opencl的使用 。
课程提纲:
  • 通用加速库cublas的使用
  • Vulkan的使用
  • opencl的使用
第十五周:dsp , fpga , npu专用加速计算
本节课将讲解dsp , fpga , npu的专用加速计算。
课程提纲:
  • dsp计算加速
  • fpga计算加速
  • npu专用加速计算
第十六周:npu使用
本节课将以嘉楠科技的k210为例 , 实现一个人脸检测案例 。
课程提纲:
  • 嘉楠科技k210芯片介绍
  • nncase人脸检测案例
感兴趣的请添加咨询顾问
05
授课方式
  • 基础知识讲解
  • 前沿论文解读
  • 论文代码复现
  • 该知识内容的实际应用
  • 该知识的项目实战
  • 该方向的知识延伸及未来趋势讲解
06
适合人群
大学生
  • 编程及深度学习基础良好 , 为了想进入AI芯片行业发展
在职人士
  • 想进入AI芯片行业的算法或IT工程师
  • 想通过掌握硬件技术 , 拓宽未来职业路径的AI算法工程师
入学基础要求
  • 掌握python 、C++开发 , 及深度学习的基础知识 。

    特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。