diffusion 大语言模型也可以自己训练了! ylc3000 2025-11-10 0 浏览 0 点赞 resource 现在自己训练或者微调 transformer 模型已经不稀奇了,那么想不想训练属于自己的基于 diffusion 的大语言模型? 来看新框架 dLLM, 这个框架能用来训练 diffusion 大语言模型,并且支持 支持 LoRA、DeepSpeed 和 FSDP 等功能。另外还内置了评估功能,这样可以评估训练的效果。 另外它还内置了个炫酷的命令行chat界面哈哈,可以看到 diffusion 大语言模型的输出过程,很有意思。 不过考虑到我之前给大家介绍过,目前 diffusion 大语言模型性能距离 transformer 模型仍然有大概2年的差距,估计只能作为玩具玩一玩。 框架地址:github.com/ZHZisZZ/dllm 网闻录 diffusion 大语言模型也可以自己训练了!