llama.cpp
CUDA: add head size 72 for flash-attn
#16962

Merged

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commits

CUDA: add head size 72

theo77186 committed 227 days ago

FAQ Terms Privacy Refunds Impressum

Loading