vllm
68c4421b - [AMD][Quantization] Add TritonScaledMMLinearKernel since int8 is broken for AMD (#12282)

Commit

155 days ago

[AMD][Quantization] Add TritonScaledMMLinearKernel since int8 is broken for AMD (#12282) Signed-off-by: Randall Smith <Randall.Smith@amd.com>

References

Author

rasmith

Parents

tests/kernels
- test_triton_scaled_mm.py
vllm/model_executor/layers/quantization/kernels/scaled_mm
- __init__.py
- triton.py