Category: 学习笔记-强化学习

Welcome

Post Categories

AI模型 4 其他 9 学习笔记-AI模型 2 博客搞建 6 Cuda算子 2 日记 3 学习笔记-大模型 9 Python 17 学习笔记-强化学习 14 ACM-ICPC 106 学习笔记- AI Infra 14 Diffusion Models 9 推荐系统 11

                            
                            RL Chapter7 DQN 家族：深度学习接入 Q-Learning
                        
                                2026-05-10
                            
                                    学习笔记-强化学习
                                
                            AI
                        
                            AI面试知识
                        
                            强化学习
                        
                            RL Chapter9 DDPG 与 SAC：连续控制的两个里程碑
                        
                                2026-05-10
                            
                                    学习笔记-强化学习
                                
                            AI
                        
                            AI面试知识
                        
                            强化学习
                        
                            RL Chapter1 MDP 与 Bellman 方程
                        
                                2026-05-09
                            
                                    学习笔记-强化学习
                                
                            AI
                        
                            AI面试知识
                        
                            强化学习
                        
                            RL Chapter0 全景与起源：从 Thorndike 的猫到 DeepSeek-R1
                        
                                2026-05-08
                            
                                    学习笔记-强化学习
                                
                            AI
                        
                            AI面试知识
                        
                            强化学习

            
2 / 2