vllm-project/vllm

Pull Requests Commits

[FEAT] [ROCm] [V1]: Add AITER biased group topk for DeepSeekV3 (#17955)

vllmellm committed 268 days ago

Verified 2d912fb6

[Bugfix][V1] Fix FlashInfer V1 backend using the wrong VllmConfig (#18086)

mgoin committed 268 days ago

Verified 12e6c0b4

[Bugfix] Fix FP8 Marlin MoE and enable for compressed-tensors models (#18026)

mgoin committed 268 days ago

Verified 9a2a6357

[core][distributed] add ep group and all2all interface (#18077)

youkaichao committed 268 days ago

Verified 6266c57b

[Bug]: Fix S3 model/tokenizer path resolution (#18083)

gilljon committed 268 days ago

Verified 754b699c

[Misc] Remove unused numpy tensor (#18084)

Roger Wang committed 268 days ago

Verified 6e27c6d8

[P/D] Add some more debug logs to `NixlConnector` (#18102)

njhill committed 268 days ago

Verified d5af47a1

[Hardware/NVIDIA/Modelopt] Fix modelopt forward method for v1 torch.compile (#18101)

pavanimajety committed 268 days ago

Verified 65f0f74b

[Fix] Support CUDAGraph capture for encoder-decoder on ROCm (#18104)

ProExpertProg committed 268 days ago

Verified 176a95c6

[v1][KVCacheManager] pass num_new_computed_tokens to kv cache manager (#18001)

heheda12345 committed 268 days ago

Verified f2ae883b

[FEAT] [ROCm]: Add AITER Block-Scaled GEMM Feature (#14968)

vllmellm committed 268 days ago

Verified 40de1ef4

[Docs] Expand security doc with firewall info (#18081)

russellb committed 268 days ago

Verified 0189a65a

[V1] DP scale-out (2/N): Decouple engine process management and comms (#15977)

njhill committed 268 days ago

Verified 55aa7af9

Update deprecated type hinting in `vllm/adapter_commons` (#18073)

hmellor committed 268 days ago

Verified 0b217da6

Update deprecated type hinting in `vllm/compilation` (#18072)

hmellor committed 268 days ago

Verified 19324d66

Give auto-merge label workflow permission to add labels to issues (#18078)

hmellor committed 268 days ago

Verified fc407a14

Convert `benchmarks` to `ruff format` (#18068)

hmellor committed 269 days ago

Verified 009d9e75

[Bugfix] Fix entrypoints metrics tests (#18063)

DarkLight1337 committed 269 days ago

Verified b922c2eb

[CI] set token permissions for pre-commit CI job (#17729)

russellb committed 269 days ago

Verified 00b14e0f

[CI] Add token permissions for add-ready-label CI job (#17730)

russellb committed 269 days ago

Verified 54e467e6

[CI] Add workflow permissions for helm CI job (#17727)

russellb committed 269 days ago

Verified 79a1d25b

[CI] Set token permissions for reminder comment CI job (#17728)

russellb committed 269 days ago

Verified 9944011b

Update deprecated type hinting in `vllm/transformers_utils` (#18058)

hmellor committed 269 days ago

Verified 8c946cec

Update deprecated type hinting in `vllm/profiler` (#18057)

hmellor committed 269 days ago

Verified ff334ca1

Update deprecated type hinting in `model_executor/layers` (#18056)

hmellor committed 269 days ago

Verified 6223dd81

[doc] add download/list/delete HF model CLI usage (#17940)

reidliu41 committed 269 days ago

Verified 906f0598

[Fix] check to make sure processor has chat templates (#18047)

aarnphm committed 269 days ago

Verified cb528d05

Convert `.buildkite` to `ruff format` (#17656)

hmellor committed 269 days ago

Verified 98fcba15

[Benchmarks] Refactor run_structured_output_benchmarks.sh (#17722)

russellb committed 269 days ago

Verified 23b3134e

[Bugfix] Fix marlin moe fallback logic for llama4 (#18042)

mgoin committed 269 days ago

Verified ea6ae8cb

Newer Older