llama.cpp
13332a75 - fix: Use per-layer sizing everywhere in kv caches

Commit

322 days ago

fix: Use per-layer sizing everywhere in kv caches Branch: GraniteFour Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>

References

Author

gabe-l-hart

Committer

gabe-l-hart

Parents