text-generation-inference
6bf7090e - fix per-column quantization

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

2 years ago

fix per-column quantization

References

#666 - feat(server): Add exllama GPTQ CUDA kernel support #553

Author

fxmarty

fxmarty

Parents

FAQ Terms Privacy Refunds Impressum

Loading