llama.cpp
4c190ba6 - cuda : reduce registers

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

2 years ago

cuda : reduce registers

References

gg/flash-attn-a

Author

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading