llama.cpp
a4e15a36 - cuda : add CUDA_USE_TENSOR_CORES and GGML_CUDA_FORCE_MMQ macros

Commit

1 year ago

cuda : add CUDA_USE_TENSOR_CORES and GGML_CUDA_FORCE_MMQ macros

References

#3776 - cuda : improve text-generation and batched decoding performance

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

Loading