llama.cpp
CUDA: fix MMQ nwarps for AMD with warp_size==32
#15014

Merged

CUDA: fix MMQ nwarps for AMD with warp_size==32 #15014

IMbackK merged 1 commit into ggml-org:master from JohannesGaessler:cuda-mmq-fix-nwarps

CUDA: fix MMQ nwarps for AMD with warp_size==32

50e1ca96

JohannesGaessler requested a review from

IMbackK 71 days ago

github-actions added Nvidia GPU

github-actions added ggml

IMbackK approved these changes on 2025-08-01

IMbackK merged 9c35706b into master 70 days ago

Reviewers

IMbackK

Assignees

No one assigned

Labels

Nvidia GPU ggml

Milestone

No milestone