llama.cpp
ggml webgpu: fix workgroup dispatch limit for large batch sizes
#19965

Merged

ggml webgpu: fix workgroup dispatch limit for large batch sizes #19965

reeselevine merged 5 commits into ggml-org:master from abhijitramesh:abhijit/webgpu-matmul-workgroup-limit

ggml-webgpu: fix workgroup dispatch limit for large batch sizes

b0169df5

ggml-webgpu: add bounds checking for over-dispatched workgroups

11253444

abhijitramesh requested a review from

reeselevine 10 days ago

github-actions added ggml

reeselevine commented on 2026-02-28

ggml-webgpu: add back TODO for spliting large sizes into batches

b92eee7d

Optimize 2d workgroup provisioning

57e9ed26

Set some parameters that increase speed

023b5658

reeselevine approved these changes on 2026-03-03

reeselevine merged 49a7564a into master 7 days ago

Reviewers

reeselevine

Assignees

No one assigned

Labels

ggml

Milestone

No milestone