Category: 学习笔记-大模型

Chapter0 全景导读：LLM 训练全链路学习路径大语言模型 2026-05-07

Chapter1 数学工具箱：相似度、散度与 LLM 损失基础大语言模型 2026-03-27

Chapter2 视觉对比学习：InfoNCE 与 SimCLR/MoCo 大语言模型 2026-03-27

Chapter3 多模态与文本对比学习：CLIP、SimCSE、BGE 与 RAG 检索器大语言模型 2026-03-28

Chapter4 自监督新范式：BYOL、SimSiam、DINO 与 EM 视角大语言模型 2026-03-29

Chapter5 SFT 与参数高效微调：MLE、LoRA、QLoRA 大语言模型 2026-03-30

Chapter6 经典 RLHF：奖励模型 RM + PPO 大语言模型 2026-05-22

Chapter7 离线对齐：DPO 家族（IPO/KTO/ORPO/SimPO）大语言模型 2026-04-03

Chapter8 推理时代与 AI Feedback：GRPO、PRM、RLAIF、Constitutional AI 大语言模型 2026-04-05

工业界 LLM 完整知识框架清单（2025–2026）—— 跨 AI_Model / AI_Infra / LLM_Foundation 全景版大语言模型 2026-05-26