llama.cpp
8875523e - vulkan: support softmax/FA batch and broadcast (#14449)

Commit

224 days ago

vulkan: support softmax/FA batch and broadcast (#14449)

References

#14435 - ggml : support broadcast for ggml_soft_max_ext and ggml_flash_attn_ext

Author

jeffbolznv

jeffbolznv

Committer

ggerganov

ggerganov

Parents

Loading