2022年薪百万赛道：高性能神经网络与AI芯片应用！( 二 ) _ncnn

项目对应第几周的课程：5~8周
▌项目3
项目名称：通用芯片加速技术
项目内容描述：cpu ， arm对应的指令集级别的加速，编译器中具体的优化策略， simd ， avx ， sse ， openblas ， neon和cpu中对于卷积的运算加速方案， cpu上的具体实例， arm上的具体实例，环境配置，神经网络的例子，加速方案的组合和实际效果。
项目使用的算法：simd ， avs ， sse ， blas ， winograd
项目使用的工具：nnpack ， qnnpack ， lowpgemm ， tvm ， ncnn
项目预期结果：学员深入掌握cpu ， arm等芯片的神经网络加速技术，并且通过一个例子来看具体的加速效果。
项目对应第几周的课程：9~12周
▌项目4
项目名称：专用芯片加速技术
项目内容描述：gpu和k210 npu及各自神经网络编译器中的加速优化技术， gpu上的cuda加速的方法， cublas ， opencl ， vulkan的开发例子， nncase上编译一个网络， k210开发板环境配置及人脸检测模型的部署
项目使用的算法：人脸检测
项目使用的工具（编程语言、工具、技术等）：Python ， C/C++ ， opencl ， vulkan ， nncase
项目预期结果：学员可以掌握gpu及npu上神经网络的编译加速，并且通过一个具体的例子来完成人脸检测模型在k210芯片上的部署。
项目对应第几周的课程：13~16周
感兴趣的请添加咨询顾问
04
详细内容介绍
第一周：轻量化网络结构设计
【2022年薪百万赛道：高性能神经网络与AI芯片应用！】本节课将讲解网络参数量、浮点运算数等模型评价指标、工具，以及分类网络，检测网络，分割网络的轻量化设计。
课程提纲：

轻量化网络设计背景介绍
网络的计算量和内存分析工具
主干网络的轻量化
检测网络的轻量化
分割网络的轻量化
典型网络的设计思路

第二周：知识蒸馏优化、低秩分解优化
本节课将讲解神经网络知识蒸馏优化、神经网络计算低秩分解加速计算方法。
课程提纲：

知识蒸馏方法介绍
知识蒸馏原理和步骤介绍
知识蒸馏训练方法缩减网络的实际分类网络演示
低秩分解原理
低秩分解加速计算在神经网络推理中的应用

第三周：网络剪枝
本节课将讲解网络稀疏性原理，网络剪枝原则及剪枝的常见方法。
课程提纲：

网络剪枝的原理
常用的剪枝策略
神经网络框架中的剪枝功能介绍
剪枝的实际使用

第四周：网络量化
本节课将讲解网络的低比特化，以及在AI芯片中的计算，实现网络量化的离线和在线感知的量化方法。
课程提纲：

网络量化的技术发展
不同离线量化算法的实现原理
神经网络框架中在线感知量化算法的原理及实现
实际案例

第五周：神经网络编译器简介
本节课将讲解tvm、ncnn、tnn、mnn的简要对比， tvm relay和网络转换，网络的编译优化和推理加速。
课程提纲：

tvm、ncnn、tnn、mnn的简要对比
tvm relay和网络转换
网络的编译优化和推理加速
tvm的实际案例

第六周：ncnn
本节课将讲解ncnn的系统架构图，数据结构，支持的框架，网络的表示，网络优化，量化，以及各平台的优化策略。
课程提纲：

特别声明：本站内容均来自网友提供或互联网，仅供参考，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。