PR #2525 CUDA: faster k-quant mul_mat_q kernels

CUDA: faster k-quant mul_mat_q kernels #2525

JohannesGaessler merged 1 commit into ggml-org:master from JohannesGaessler:cuda-faster-mmq-4

CUDA: faster k-quant mul_mat_q kernels

fe6a8f80

slaren commented on 2023-08-05

slaren approved these changes on 2023-08-05

JohannesGaessler merged f514d1b3 into master 2 years ago

Reviewers

slaren

Assignees

No one assigned

Labels

None yet

Milestone

No milestone