CMU硬核NLP课公开:从手撸LLaMA到推理侧Scaling
卡内基梅隆大学(CMU)教授Sean Welleck公开了其最新的《高级自然语言处理》全套课程。这套资源包含23讲完整视频、课件及20个代码示例,知识体系从Tokenizer、Transformer基础一路覆盖到RAG、多模态、RLHF,以及当下最受关注的DeepSeek-R1同款推理侧Scaling和Mixture of Experts。课程第一项作业就要求学生从零构建一个LLaMA,实操性极强
github.com/cmu-l3/anlp-spring2026-code