PR #4280 llama : pad KV cache size

llama : pad KV cache size #4280

ggerganov merged 2 commits into master from gg/pad-kv-cache

llama : pad KV cache size to 32

3e68df86

ggerganov force pushed to 3e68df86 2 years ago

metal : try to improve batched decoding

3cb1c348

ggerganov force pushed to 3cb1c348 2 years ago

ggerganov merged d7b800b8 into master 2 years ago

Reviewers

No reviews

Assignees

No one assigned

Labels

None yet

Milestone

No milestone