llama.cpp
91c73601 - llama : add gguf_remove_key + remove split meta during quantize (#6591)

Commit

2 years ago

llama : add gguf_remove_key + remove split meta during quantize (#6591) * Remove split metadata when quantize model shards * Find metadata key by enum * Correct loop range for gguf_remove_key and code format * Free kv memory --------- Co-authored-by: z5269887 <z5269887@unsw.edu.au>

References

#6591 - Remove split metadata when quantize model shards

Author

zj040045

Parents

5c4d767a

llama.cpp 91c73601 - llama : add gguf_remove_key + remove split meta during quantize (#6591)

llama.cpp
91c73601 - llama : add gguf_remove_key + remove split meta during quantize (#6591)