llama.cpp
69664749 - cuda : play with faster Q4_0 dequantization

Commit

2 years ago

cuda : play with faster Q4_0 dequantization

References

cuda-batched-gemm-deq

Author

ggerganov

ggerganov

Parents

Loading