llama.cpp
cb5fad4c - CUDA: refactor and optimize IQ MMVQ (#8215)

Commit

2 years ago

CUDA: refactor and optimize IQ MMVQ (#8215) * CUDA: refactor and optimize IQ MMVQ * uint -> uint32_t * __dp4a -> ggml_cuda_dp4a * remove MIN_CC_DP4A checks * change default * try CI fix

References

#8215 - CUDA: refactor and optimize IQ MMVQ

Author

JohannesGaessler

Parents

dae57a1e

llama.cpp cb5fad4c - CUDA: refactor and optimize IQ MMVQ (#8215)

llama.cpp
cb5fad4c - CUDA: refactor and optimize IQ MMVQ (#8215)