Inference
版本发布时间: 2023-04-05 10:22:45
chenzomi12/AISystem最新发布版本:Hardware(2023-11-26 07:51:49)
Release第二部分AI推理引擎相关 Slide。
编号 | 名称 | 具体内容 |
1 | 推理系统 | 推理系统整体介绍,推理引擎架构梳理 |
2 | 轻量网络 | 轻量化主干网络,MobileNet等SOTA模型介绍 |
3 | 模型压缩 | 模型压缩4件套,量化、蒸馏、剪枝和二值化 |
4 | 模型转换&优化 | AI框架训练后模型进行转换,并对计算图优化 |
5 | Kernel优化 | Kernel层、算子层优化,对算子、内存、调度优化 |
1、 Inference.zip 489.02MB