text-generation-inference
c6e8b944 - fix(server): fix quantization for sharded models (#45)

Commit

3 years ago

fix(server): fix quantization for sharded models (#45)

Author

OlivierDehaene

OlivierDehaene

Parents

Loading