LM Studio里跑一个大模型,速度20-25 tok/s。换成纯粹的llama.cpp,速度飙到50+ tok/s。性能直接翻倍。 - 网闻录