Course Book
从方法理解到可运行实作
课程书把量化、压缩、蒸馏、runtime 选型和 profiling 放回同一个目标: 让模型在目标设备上稳定达到业务可用标准。每个核心概念都会对应图示、 代码片段、实验任务和验收结果。
Book图文课程书
LabUbuntu/Qwen 实作
SlidesHTML 课件
面向真实设备的模型量化、压缩与部署课程书。内容以工程判断为主线, 配套 Ubuntu Server、NVIDIA GPU 和 Qwen 小模型实作。

课程书把量化、压缩、蒸馏、runtime 选型和 profiling 放回同一个目标: 让模型在目标设备上稳定达到业务可用标准。每个核心概念都会对应图示、 代码片段、实验任务和验收结果。