PR #20451 vulkan: Slang flash attention shader

vulkan: Slang flash attention shader #20451

0cc4m wants to merge 6 commits into master from 0cc4m/vulkan-slang-flash-attention

github-actions added Vulkan

github-actions added ggml

vulkan: port Flash Attention shader to Slang

a4ac1d90

fix slang issues

e1b40fa5

generic reductions

2c623bfa

move kv shmem staging to function

0349025d

Revert "move kv shmem staging to function"

e880cb2e

unify scalar+vector and fix reduce function

5ec6569e

0cc4m force pushed from f43252d5 to 5ec6569e 91 days ago

Reviewers

No reviews

Assignees

No one assigned

Labels

Vulkan ggml

Milestone

No milestone