llama.cpp
opencl: add kernel to handle mat mul in attention to improve encoding speed
#17181

Merged

opencl: add kernel to handle mat mul in attention to improve encoding speed #17181

max-krasnyansky merged 7 commits into ggml-org:master from qualcomm:sq/mul-mat-kq-kqv-opt-new

Add mul_mm_f16_f32_kq_kqv kernel

9e5c5960

Add ggml_cl_mul_mat_kq_kqv_adreno func

24f32df4

fix whitespace

dada5171

remove unused variable

0fc4b8bd

remove redundant

301662b2

refactor and clean up

41bf54f8

shaofeiqi requested a review from

lhez 31 days ago

shaofeiqi requested a review from

max-krasnyansky 31 days ago

github-actions added ggml

github-actions added OpenCL

remove trailing whitespace

b3ee2ab0

max-krasnyansky approved these changes on 2025-11-16

max-krasnyansky merged 4db56412 into master 27 days ago

Reviewers

max-krasnyansky

lhez

Assignees

No one assigned

Labels

ggml OpenCL

Milestone

No milestone