PR #13439 CUDA: fix crash with partial offloading of MoE

CUDA: fix crash with partial offloading of MoE #13439

JohannesGaessler merged 1 commit into ggml-org:master from JohannesGaessler:cuda-fix-partial-mmid

github-actions added Nvidia GPU

github-actions added ggml

JohannesGaessler force pushed 1 year ago

CUDA: fix crash with partial offloading of MoE

4bc8f75d

JohannesGaessler force pushed to 4bc8f75d 1 year ago

slaren approved these changes on 2025-05-11

JohannesGaessler merged 7474e00b into master 1 year ago

Reviewers

slaren

Assignees

No one assigned

Labels

Nvidia GPU ggml

Milestone

No milestone