vllm-project/vllm

Pull Requests Commits

Robert Shaw committed 152 days ago

45c02abd

Robert Shaw committed 152 days ago

d0bb3fa0

Robert Shaw committed 152 days ago

81fdcec2

Robert Shaw committed 156 days ago

f65450e3

Robert Shaw committed 156 days ago

bd57841c

Robert Shaw committed 156 days ago

f16bf638

Robert Shaw committed 156 days ago

b835205d

Robert Shaw committed 156 days ago

c22a6cb1

robertgshaw2-redhat committed 162 days ago

7fbcbbfc

robertgshaw2-redhat committed 162 days ago

ff5a0cfa

robertgshaw2-redhat committed 162 days ago

56939c83

robertgshaw2-redhat committed 162 days ago

1172b70b

robertgshaw2-redhat committed 162 days ago

15bc311d

robertgshaw2-redhat committed 162 days ago

70b76554

update for use batched

robertgshaw2-redhat committed 162 days ago

128eca2c

robertgshaw2-redhat committed 162 days ago

6babd393

robertgshaw2-redhat committed 162 days ago

491347cb

robertgshaw2-redhat committed 162 days ago

569de248

add comment about hack

robertgshaw2-redhat committed 162 days ago

f015919f

Merge pull request #17 from praveingk/batching

robertgshaw2-redhat committed 162 days ago

Verified 39e6bd19

Increase chunk size to reduce no. of threads

praveingk committed 162 days ago

c4b9b2e6

Add threading for load-balancing to different workers

praveingk committed 162 days ago

17546dc7

robertgshaw2-redhat committed 163 days ago

5d8b6653

robertgshaw2-redhat committed 163 days ago

cda2f2c4

updated to make send_notif work

robertgshaw2-redhat committed 163 days ago

b9be6fd3

robertgshaw2-redhat committed 163 days ago

8283d7b8

robertgshaw2-redhat committed 163 days ago

c481d30c

robertgshaw2-redhat committed 163 days ago

dedb1a54

robertgshaw2-redhat committed 163 days ago

ee2a4b08

robertgshaw2-redhat committed 165 days ago

f9617c75

Older