vllm
e84e0735 - fix: revert cast to cpu in `MsgpackEncoder._encode_tensor` to avoid hidden performance regressions (#25738)

Commit

212 days ago

fix: revert cast to cpu in `MsgpackEncoder._encode_tensor` to avoid hidden performance regressions (#25738) Signed-off-by: Andrew Sansom <andrew@protopia.ai>

References

#25738 - fix: revert cast to cpu in `MsgpackEncoder._encode_tensor` to avoid hidden performance regressions

Author

qthequartermasterman

Parents

3edf87d2

vllm e84e0735 - fix: revert cast to cpu in `MsgpackEncoder._encode_tensor` to avoid hidden performance regressions (#25738)

vllm
e84e0735 - fix: revert cast to cpu in `MsgpackEncoder._encode_tensor` to avoid hidden performance regressions (#25738)