llama.cpp
sycl : port multi-column MMVQ from CUDA backend (~45% speculative decoding speedup on Intel Arc)
#21845

Merged

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

FAQ Terms Privacy Refunds Impressum

Loading