llama.cpp
af99c6fb - llama : remove memory_f16 and kv_f16 flags

Commit

2 years ago

llama : remove memory_f16 and kv_f16 flags

References

gg/quantum-k-cache

#4312 - llama : support quantum K cache

Author

ggerganov

ggerganov

Parents

Loading