KV 缓存与注意力机制优化：如何将计算复杂度从 O(n²) 降至 O(n)

Pratham Grover 2025-10-24 0 浏览 0 点赞长文

KV Caching: Attention Optimization from O(n²) to O(n)

#AI #KV缓存 #LLM #Transformer #性能优化 #机器学习 #注意力机制 #深度学习 #算法优化

来源: Medium