PR #15957 CUDA: Optimize PAD_REFLECT_1D

CUDA: Optimize PAD_REFLECT_1D #15957

JohannesGaessler merged 11 commits into ggml-org:master from bugparty:PAD_REFLECT_1D_expriment

CUDA: Optimize PAD_REFLECT_1D

1e29fafa

github-actions added testing

github-actions added Nvidia GPU

github-actions added ggml

JohannesGaessler commented on 2025-09-14

use fast_div to improve performance

9494833b

Apply suggestion from @JohannesGaessler

85835527

Apply suggestion from @JohannesGaessler

a5ef1d09

JohannesGaessler commented on 2025-09-15

optimize

b3cf133a

use a concise expression to further speedup the cuda kernel

d73ba84a

add comment for rel_i0

e280cb87

bugparty commented on 2025-09-15

Merge branch 'ggml-org:master' into PAD_REFLECT_1D_expriment

188ce93e

Merge branch 'ggml-org:master' into PAD_REFLECT_1D_expriment

4286ea78

Merge branch 'ggml-org:master' into PAD_REFLECT_1D_expriment

dd6789b1

bugparty requested a review from

JohannesGaessler 307 days ago

Merge branch 'ggml-org:master' into PAD_REFLECT_1D_expriment

aa12620c

JohannesGaessler approved these changes on 2025-09-18

JohannesGaessler merged 38dbdf4c into master 306 days ago

Reviewers

JohannesGaessler

Assignees

No one assigned

Labels

testing Nvidia GPU ggml

Milestone

No milestone