llama.cpp
128118fd - convert : use F32 for dequant of pack-quantized tensors

Commit

142 days ago

convert : use F32 for dequant of pack-quantized tensors

References

compilade/convert-prequant-compressed-tensors

#17069 - convert : handle compressed-tensors quant method

Author

compilade

compilade

Parents

Loading