vllm
[Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py` + Add Triton Fused MoE kernel config for FP8 E=16 on B200
#20516

Merged

[Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py` + Add Triton Fused MoE kernel config for FP8 E=16 on B200 #20516

DarkLight1337 merged 2 commits into vllm-project:main from fix/benchmark

fix

b9345566

b8zhong force pushed to b9345566 213 days ago

mergify added performance

gemini-code-assist commented on 2025-07-05

add config file

3a5a0847

DarkLight1337 approved these changes on 2025-07-06

DarkLight1337 enabled auto-merge (squash) 213 days ago

github-actions added ready

DarkLight1337 merged cede942b into main 213 days ago

b8zhong changed the title ~~[Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py`~~ [Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py` + Add Triton Fused MoE kernel config for FP8 E=16 on B200 213 days ago

b8zhong deleted the fix/benchmark branch 213 days ago

Reviewers

DarkLight1337

gemini-code-assist

Assignees

No one assigned

Labels

performance ready

Milestone

No milestone

vllm [Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py` + Add Triton Fused MoE kernel config for FP8 E=16 on B200 #20516 Merged

[Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py` + Add Triton Fused MoE kernel config for FP8 E=16 on B200 #20516

vllm
[Benchmark] Add support for multiple batch size benchmark through CLI in `benchmark_moe.py` + Add Triton Fused MoE kernel config for FP8 E=16 on B200
#20516

Merged