vllm
[Perf] Fuse Zero Initializer for FP8 DeepGemm Block Quant Kernel
#39547

Merged

[Perf] Fuse Zero Initializer for FP8 DeepGemm Block Quant Kernel #39547

vllm-bot merged 9 commits into vllm-project:main from wzhao18:wzhao/fuse-fp8-quant-zero-init

wzhao18 marked this pull request as ready for review 33 days ago

wzhao18 requested a review from

mgoin 33 days ago

wzhao18 requested a review from

tlrmchlsmth 33 days ago

wzhao18 requested a review from

WoosukKwon 33 days ago

wzhao18 requested a review from

yewentao256 33 days ago

gemini-code-assist commented on 2026-04-10

mgoin approved these changes on 2026-04-10

mgoin added performance

mgoin added ready

mgoin added nvidia

fuse fp8 packed quant zero init into quant kernel

200a0d4c

fixup

bdf7e5e8

fixup

99c8ab30

Update comments

434e1c46

Simplify tests

1db6ccf8

Fix sync threads divergence

0b680696

Update comments

6d515b45

Explicitly set device=cpu in tests

6f90e9f1

test with poisoned scales

e77a6515

wzhao18 force pushed to e77a6515 33 days ago

vllm-bot merged 59b2f7b6 into main 32 days ago

Reviewers

mgoin

gemini-code-assist

tlrmchlsmth

WoosukKwon

yewentao256

Assignees

No one assigned

Labels

performance ready nvidia

Milestone

No milestone

vllm [Perf] Fuse Zero Initializer for FP8 DeepGemm Block Quant Kernel #39547 Merged

[Perf] Fuse Zero Initializer for FP8 DeepGemm Block Quant Kernel #39547

vllm
[Perf] Fuse Zero Initializer for FP8 DeepGemm Block Quant Kernel
#39547

Merged