llama.cpp
CUDA: fix crash on large batch size for quant. MoE
#13537

Merged

CUDA: fix crash on large batch size for quant. MoE #13537

JohannesGaessler merged 1 commit into ggml-org:master from JohannesGaessler:cuda-fix-dsr1-max-batch

CUDA: fix crash on large batch size for quant. MoE

634be72d

github-actions added Nvidia GPU

github-actions added ggml

slaren commented on 2025-05-14

slaren approved these changes on 2025-05-14

JohannesGaessler merged 4696d567 into master 1 year ago

Reviewers

slaren

Assignees

No one assigned

Labels

Nvidia GPU ggml

Milestone

No milestone