llama.cpp
71e90e88 - quantize: Handle user-defined quantization levels for additional tensors (#12511)

Commit

180 days ago

quantize: Handle user-defined quantization levels for additional tensors (#12511) * Add llama_model_quantize_params parameters * Add new quantize parameters parsing and validation * Update usage * Add new parameters defaults * Add new quantization parameters logic * Add llama_model_quantize_params parameters * Add new quantize parameters parsing and validation * Update usage * Add new parameters defaults * Add new quantization parameters logic * Minor refactoring as per the contributors' coding guidelines * Update descriptions to match existing style * Add llama_model_quantize_params parameters * Add new quantize parameters parsing and validation * Update usage * Add new parameters defaults * Add new quantization parameters logic * Minor refactoring as per the contributors' guidelines * Implement general --tensor-type instead of tensor-specific command option * Fix implied type bug * Restore missing #includes * Add regex capability for tensor selection * Refactor function name and update ALLOWED_TENSOR_TYPE * Add missing #include * Handle edge case when tensor name is cls.output * Minor logging improvement

References

#12511 - quantize: Handle user-defined quantization levels for additional tensors

Author

EAddario

Parents

bc091a4d

llama.cpp 71e90e88 - quantize: Handle user-defined quantization levels for additional tensors (#12511)

llama.cpp
71e90e88 - quantize: Handle user-defined quantization levels for additional tensors (#12511)