跳到主要内容

端侧模型量化部署技术专题

面向真实设备的模型量化、压缩与部署课程书。内容以工程判断为主线, 配套 Ubuntu Server、NVIDIA GPU 和 Qwen 小模型实作。

Course Book

从方法理解到可运行实作

课程书把量化、压缩、蒸馏、runtime 选型和 profiling 放回同一个目标: 让模型在目标设备上稳定达到业务可用标准。每个核心概念都会对应图示、 代码片段、实验任务和验收结果。

Book图文课程书
LabUbuntu/Qwen 实作
SlidesHTML 课件