llama.cpp
b957b8f5 - cuda : add flash_attn kernel (wip)

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

1 year ago

cuda : add flash_attn kernel (wip)

References

gg/flash-attn-cuda

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading