PR #14551 CUDA: add set rows for f32 and f16

CUDA: add set rows for f32 and f16 #14551

ggerganov merged 4 commits into ggml-org:master from am17an:cuda_set_rows

github-actions added Nvidia GPU

github-actions added ggml

am17an requested a review from

JohannesGaessler 271 days ago

am17an force pushed 271 days ago

ggerganov commented on 2025-07-07

JohannesGaessler commented on 2025-07-07

am17an force pushed 269 days ago

JohannesGaessler commented on 2025-07-08

github-actions added examples

am17an force pushed 269 days ago

CUDA: add set rows for f32 and f16

853bc5ec

Review: change kernel params, use strides from host

15e1b897

Use 1-d kernel

85e2a202

am17an force pushed to 85e2a202 266 days ago

am17an requested a review from

JohannesGaessler 266 days ago

JohannesGaessler commented on 2025-07-12

Review: use int64_t for blockDim.x, rename nb->s for clarity

9deb7644

am17an requested a review from

JohannesGaessler 266 days ago

JohannesGaessler approved these changes on 2025-07-12

ggerganov merged 7de5c7ca into master 265 days ago

am17an deleted the cuda_set_rows branch 164 days ago

Reviewers

JohannesGaessler

slaren

ggerganov

Assignees

No one assigned

Labels

Nvidia GPU examples ggml

Milestone

No milestone