llama.cpp
986b3da7 - llama : offload KV cache per-layer

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

2 years ago

llama : offload KV cache per-layer

References

#4309 - llama : per-layer KV cache

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading