vllm-project/vllm

Pull Requests Commits

skip detokenize

Woosuk Kwon committed 151 days ago

cb439737

Woosuk Kwon committed 151 days ago

a1cac484

Woosuk Kwon committed 151 days ago

6102536d

Woosuk Kwon committed 151 days ago

f65da69c

Fix uv error from tvm-ffi

Woosuk Kwon committed 153 days ago

a5281395

Remove /generate API

Woosuk Kwon committed 153 days ago

eda71c28

Add /generate API

Woosuk Kwon committed 154 days ago

1bff9a59

disable flashinfer warmup

Woosuk Kwon committed 158 days ago

69c9a015

Merge branch 'main' into woosuk/test-router

Woosuk Kwon committed 158 days ago

8935ca20

[ci] Adjusting AMD test composition 2025-10-14 (#26852)

Alexei-V-Ivanov-AMD committed 158 days ago

Verified 938c43ea

Move query quantization to attention layer for Flashinfer & Triton. (#26534)

adabeyta committed 159 days ago

Verified 0a9ef0cf

[Bug] Temporally Disable `VLLM_ALLREDUCE_USE_SYMM_MEM` by Default (#26925)

yewentao256 committed 159 days ago

Verified e5b438a2

support flashinfer_fp4 moe for 5090 gpu (#26669)

XiaobingSuper committed 159 days ago

Verified 0b99f5d3

Vectorize RMS norm variance using vectorize_read_with_alignment (#26234)

bbeckca committed 159 days ago

Verified 1f491aa0

[NVIDIA] Add support for cudnn fp4 gemm via flashinfer (#26107)

kaixih committed 159 days ago

Verified de92d916

[Chore] Clean up CODEOWNERS (#26923)

WoosukKwon committed 159 days ago

Verified a1063628

[ModelOpt] Remove NVFP4 MoE K%16==0 constraint (#26891)

XiaobingSuper committed 159 days ago

Verified d7963752

[Feature]: Use pydantic validation in observability.py config (#26637)

cern1710 committed 159 days ago

Verified 14f84563

Olmo 3 tool parser and tests (#26143)

pdasigi committed 159 days ago

Verified 4794c2bd

Lower sevarity of log when model info cache misses due to exception (#26917)

hmellor committed 159 days ago

Verified d3cbaa08

[Chore] Separate out `vllm.utils.async_utils` (#26913)

DarkLight1337 committed 159 days ago

Verified 828523ad

[Chore] Separate out `vllm.utils.func` (#26904)

DarkLight1337 committed 159 days ago

Verified 136a17fe

[BugFix] Patch inductor memory plan logic (#26878)

BoyuanFeng committed 159 days ago

Verified f5743833

chore: remove unused marker (#26890)

max-wittig committed 159 days ago

Verified 5d598680

[Misc] rename torch_dtype to dtype (#26695)

wangxiyuan committed 159 days ago

Verified 8f4b313c

[Misc] Remove `isort` and `yapf` ignores (#26888)

DarkLight1337 committed 159 days ago

Verified f93e3480

[Model][2/N] Improve all pooling task | Support multi-vector retrieval (#25370)

noooop committed 159 days ago

Verified f54f8512

[Lora]Load tuned multi-lora kernel configs from json files (#26319)

li2haipeng committed 159 days ago

Verified d4d1a602

[Platform] allow platform to init dp group (#22243)

wangxiyuan committed 159 days ago

Verified db1764e4

[Easy] Get rid of unnecessary paraenthesis in kv_cache_manager (#26842)

Jialin committed 159 days ago

Verified 7f83b4ee

Older