DeepSpeed
adding 8bit dequantization kernel for asym fine-grained block quantization in zero-inference
#4450

Merged

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

FAQ Terms Privacy Refunds Impressum

Loading