llama.cpp
2c04beeb - cuda : avoid extra QxQ matrix in shared memory

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

2 years ago

cuda : avoid extra QxQ matrix in shared memory

Author

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading