vllm
[AMD][FP8] Using MI300 FP8 format on ROCm for block_quant
#12134

Merged

[AMD][FP8] Using MI300 FP8 format on ROCm for block_quant #12134

mgoin merged 1 commit into vllm-project:main from ROCm:deepseek_v3_rocm_weights

Requantizing fp8 weights into NANOO format on rocm platform. Conditio…

1d54e3cb

mgoin approved these changes on 2025-01-17

mgoin added ready

mgoin enabled auto-merge (squash) 324 days ago

mgoin merged b5b57e30 into main 324 days ago

Reviewers

mgoin

Assignees

No one assigned

Labels

ready

Milestone

No milestone