LM Studio里跑一个大模型，速度20-25 tok/s。换成纯粹的llama.cpp，速度飙到50+ tok/s。性能直接翻倍。 - 网闻录

资源网闻录2小时前18 阅读

资源网闻录2小时前18 阅读来源: user

https://github.com/mostlygeek/llama-swap

018

LM Studio里跑一个大模型，速度20-25 tok/s。换成纯粹的llama.cpp，速度飙到50+ tok/s。性能直接翻倍。 - 网闻录