vllm
fa63e710 - [V1][Perf] Reduce scheduling overhead in model runner after cuda sync (#12094)

Commit

328 days ago

[V1][Perf] Reduce scheduling overhead in model runner after cuda sync (#12094) Signed-off-by: Keyun Tong <tongkeyun@gmail.com>

References

Author

youngkent

Parents