学生实跑覆盖索引
本页把第一轮“按学生视角从头到尾操作”的公开运行记录映射到课程结构。它不是新的实验要求,只是帮助学生和教师确认:哪些结论有真实日志支撑,哪些是 60 学时或后续扩展。
公开运行记录仓库:edge-ai-deployment-course-runs
主线覆盖
| 课程位置 | 已实跑证据 | 对应报告位置 | 结论 |
|---|---|---|---|
| Start Here / 环境建立 | server smoke run | 第 1-3 节 | 服务器环境、llama.cpp 构建、Qwen baseline 可以跑通 |
| Part I 前置工具链 | server smoke run | 第 2 节 | 环境字段、GPU、CUDA、模型 SHA256 需要从真实命令记录 |
| Part II 端侧约束 / Jetson | Jetson login check、Jetson env/build preflight、Jetson Qwen baseline | 第 2、7 节 | Jetson 要单独记录访问方式、JetPack/L4T、功耗模式、tegrastats |
| Part III 量化 | Qwen quantization comparison | 第 4 节 | Q4/Q5/Q8 都要同时看速度、文件大小和输出质量 |
| Part IV 微调 | Qwen LoRA smoke run | 第 8、9 节 | 5-step LoRA 只能证明 pipeline,不证明 adapter 值得部署 |
| Part V 推理加速 | inference acceleration server run | 第 5 节 | -ngl、ctx、threads、llama-bench 要分开解释 |
| Part V Profiling | profiling record run | 第 5、7 节 | timing、显存、功耗和输出质量都要能追溯到日志 |
| Part VI 本地服务 | Jetson local service | 第 6、7 节 | HTTP 200 不等于答案质量合格,server 构建和端口也要记录 |
| Part VII VLM/Agent / 最终复盘 | final agent review run | 第 7-9 节 | Agent 输出必须做 schema + policy 校验,最终建议必须回到证据 |
第一轮未作为必做实验的内容
| 内容 | 当前处理 |
|---|---|
| 完整本地 VLM 推理 | 作为 60 学时/后续扩展;第一轮只验证本地 LLM 服务和 Agent 权限边界 |
| vLLM serving | 作为扩展阅读和后续实验;第一轮主线用 llama.cpp server |
| Android / MLC / LiteRT 实机 | 作为移动端路线图;第一轮未实测 |
| TensorRT-LLM / Triton / 云端集群 serving | 不作为本课程第一轮必做路径 |
| 长时间稳定性和并发压测 | 已在风险中登记,后续需要专门实验 |
使用方式
学生写最终报告时,每个关键结论至少回到一条运行记录或本地日志:
结论 -> 证据日志或公开运行记录 -> 风险判断 -> 下一步动作
如果某项没有实测,报告写“未记录”或“未做扩展”,不要用别人的数字补空格。