教师使用指南
本页面向教师和课程设计者。学生第一次学习可以先读 Start Here。
40 学时讲法
40 学时只保留主线:
Qwen -> GGUF -> llama.cpp -> Q8/Q5/Q4 -> profiling -> local API -> final report
建议取舍:
| 内容 | 处理 |
|---|---|
| LoRA/QLoRA | 讲判断框架,实验作为 smoke test 或选做 |
| Jetson | 有设备就做一组迁移,没有设备就做路线阅读 |
| vLLM/TensorRT/MLC/LiteRT | 放入 runtime 横向比较,不做必做实验 |
| VLM/Agent | 只做系统设计复盘,不展开平台开发 |
60 学时讲法
60 学时可以加入:
- 微调到再量化的完整闭环。
- Jetson 功耗、温度和长稳测试。
- vLLM serving 和 benchmark 选做。
- MLC LLM、LiteRT、Arm Android 路线调研。
- VLM/Agent 端云协同复盘。
这些扩展仍然要回到最终报告,不能变成工具展示。
项目里程碑
| 里程碑 | 时间点 | 交付物 |
|---|---|---|
| M0 | 第 1 次课后 | 环境记录表 |
| M1 | Part I 结束 | 推理指标小测和 baseline plan |
| M2 | Part III 结束 | Q8/Q5/Q4 量化对比表 |
| M3 | Part V 结束 | runtime/profiling 对比表 |
| M4 | Part VI 结束 | local API smoke test 和服务日志 |
| M5 | 课程结束 | 端侧部署评估报告 |
评分建议
| 维度 | 权重 | 看什么 |
|---|---|---|
| 问题定义 | 15% | 场景、设备、约束是否清楚 |
| 实验可复现 | 20% | 命令、版本、模型、日志路径是否完整 |
| 量化判断 | 20% | 能否解释速度、内存和质量取舍 |
| 推理加速判断 | 15% | 能否区分 offload、ctx、kernel、服务开销 |
| Profiling 质量 | 15% | 是否有真实记录和失败分析 |
| 工程结论 | 15% | 推荐和不推荐方案是否有证据 |
课堂演示建议
- 演示只跑一组最短 baseline,避免课堂时间被下载模型吃掉。
- 量化对比可以用教师预先准备的日志讲解。
- Jetson 演示前先确认电源、散热和存储。
- 学生报告必须引用自己的日志路径,不接受只有截图的结论。