DeepLearning.AI 新课程：大语言模型的微调与强化学习后训练入门

Sharon Zhou 2025-10-30 0 浏览 0 点赞长文

大语言模型的微调与强化学习：后训练入门

#AI #DeepLearning.AI #GRPO #LLM #LoRA #PPO #RLHF #免费课程 #后训练

来源: DeepLearning.AI