llama.cpp
Add ability to use Q5_0, Q5_1, and IQ4_NL for quantized K cache
#6183

Merged

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

FAQ Terms Privacy Refunds Impressum

Loading