2026-06-17
Chapter1 Linear 量化全景
2026-06-17
学习笔记- AI Infra
0. AI Infra 知识框架
2026-05-26
学习笔记- AI Infra
Chapter6 经典 RLHF:奖励模型 RM + PPO
2026-05-22
学习笔记-大模型
0. KV Cache
2026-05-14
学习笔记- AI Infra
2. 1F1B
2026-05-11
学习笔记- AI Infra
1. GPipe:朴素流水线与 micro-batch
2026-05-10
学习笔记- AI Infra
3. Interleaved 1F1B
2026-05-10
学习笔记- AI Infra
RL Chapter10 探索:从 ε-greedy 到 Curiosity
2026-05-10
学习笔记-强化学习