学生实跑覆盖索引

本页把第一轮“按学生视角从头到尾操作”的公开运行记录映射到课程结构。它不是新的实验要求，只是帮助学生和教师确认：哪些结论有真实日志支撑，哪些是 60 学时或后续扩展。

主线覆盖

课程位置	已实跑证据	对应报告位置	结论
Start Here / 环境建立	server smoke run	第 1-3 节	服务器环境、llama.cpp 构建、Qwen baseline 可以跑通
Part I 前置工具链	server smoke run	第 2 节	环境字段、GPU、CUDA、模型 SHA256 需要从真实命令记录
Part II 端侧约束 / Jetson	Jetson login check、Jetson env/build preflight、Jetson Qwen baseline	第 2、7 节	Jetson 要单独记录访问方式、JetPack/L4T、功耗模式、`tegrastats`
Part III 量化	Qwen quantization comparison	第 4 节	Q4/Q5/Q8 都要同时看速度、文件大小和输出质量
Part IV 微调	Qwen LoRA smoke run	第 8、9 节	5-step LoRA 只能证明 pipeline，不证明 adapter 值得部署
Part V 推理加速	inference acceleration server run	第 5 节	`-ngl`、ctx、threads、`llama-bench` 要分开解释
Part V Profiling	profiling record run	第 5、7 节	timing、显存、功耗和输出质量都要能追溯到日志
Part VI 本地服务	Jetson local service	第 6、7 节	HTTP 200 不等于答案质量合格，server 构建和端口也要记录
Part VII VLM/Agent / 最终复盘	final agent review run	第 7-9 节	Agent 输出必须做 schema + policy 校验，最终建议必须回到证据

内容	当前处理
完整本地 VLM 推理	作为 60 学时/后续扩展；第一轮只验证本地 LLM 服务和 Agent 权限边界
vLLM serving	作为扩展阅读和后续实验；第一轮主线用 llama.cpp server
Android / MLC / LiteRT 实机	作为移动端路线图；第一轮未实测
TensorRT-LLM / Triton / 云端集群 serving	不作为本课程第一轮必做路径
长时间稳定性和并发压测	已在风险中登记，后续需要专门实验

学生写最终报告时，每个关键结论至少回到一条运行记录或本地日志：

结论 -> 证据日志或公开运行记录 -> 风险判断 -> 下一步动作

如果某项没有实测，报告写“未记录”或“未做扩展”，不要用别人的数字补空格。