llama.cpp
55cf48de - cuda : fix multi-seq, quantized FA

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

217 days ago

cuda : fix multi-seq, quantized FA ggml-ci

References

gg/fix-fa-q-non-cont

Author

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading