vllm
27b78c73 - [Kernel] add triton fused moe kernel for gptq/awq (#12185)

Commit

166 days ago

[Kernel] add triton fused moe kernel for gptq/awq (#12185)

References

#12185 - [Kernel] add triton fused moe kernel for gptq/awq

Author

jinzhen-lin

jinzhen-lin

Parents

Files4

tests/kernels
- test_moe.py
vllm/model_executor/layers
- fused_moe
  - fused_moe.py
- quantization
  - __init__.py
  - moe_wna16.py

Loading