llama.cpp
4a3156de - CUDA: faster dequantize kernels for Q4_0 and Q4_1 (#4938)

Commit

2 years ago

CUDA: faster dequantize kernels for Q4_0 and Q4_1 (#4938) Co-authored-by: Iwan Kawrakow <iwan.kawrakow@gmail.com>

References

Author

ikawrakow

Parents