Reinforcement Learning of Large Language Models, Spring 2025 Ernest K. Ryu 2025-01-15 0 浏览 0 点赞 长文 这是一门关于大语言模型强化学习的课程,内容全面涵盖了深度强化学习与自然语言处理两个领域。 课程内容分为三个部分: **1. 讲义部分** 包含引言、深度强化学习、大语言模型以及大语言模型的强化学习四个章节。 **2. 视频讲座** - 基础部分:马尔科夫决策过程、模仿学习、深度策略评估 - 深度策略梯度:A3C、PPO、GRPO - AlphaGo及专家迭代 - 自然语言处理:语言建模、循环神经网络、Transformer架构(BERT、GPT-1等) - 上下文学习与指令微调 - 基于人类反馈和可验证奖励的强化学习方法 **3. 课程附加信息** 课程由UCLA数学系助理教授Ernest K. Ryu主讲。课程要求具有图像分类层面的深度学习基础,对强化学习或大语言模型不要求有先前经验,但需要熟悉条件期望和全期望定律等数学概念。 该课程不仅系统讲解技术原理,还结合了业界最新进展,适合希望深入理解AI技术交叉点的同学。 课程官方网站 Reinforcement Learning of Large Language Models 课程完整资料 #AI #BERT #GPT #PPO #Transformer #大语言模型 #强化学习 #机器学习 #深度学习 #自然语言处理