vllm
a8c53682 - Consolidate Nvidia ModelOpt quant config handling for all quantization methods (#28076)

Commit

98 days ago

Consolidate Nvidia ModelOpt quant config handling for all quantization methods (#28076) Signed-off-by: Shengliang Xu <shengliangx@nvidia.com>

References

Author

shengliangxu

Parents