llama.cpp
dd86df82 - metal : use mm kernel only for quantum KV cache

Commit

2 years ago

metal : use mm kernel only for quantum KV cache

References

#4312 - llama : support quantum K cache

Author

ggerganov

ggerganov

Parents

Loading