vllm
[Core] Default to using per_token quantization for fp8 when cutlass is supported.
#8651

Merged

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

FAQ Terms Privacy Refunds Impressum

Loading