vllm
5b80f220 - [Perf] Optimize `reshape_and_cache` CUDA Kernel (#25955)

Commit

204 days ago

[Perf] Optimize `reshape_and_cache` CUDA Kernel (#25955) Signed-off-by: zjy0516 <riverclouds.zhu@qq.com> Co-authored-by: Liu-congo <1502632128@qq.com> Signed-off-by: yewentao256 <zhyanwentao@126.com>

References

#25293 - [Refactor] Refactor FP8 & INT8 Quant Folder inside `w8a8`

Author

ZJY0516

Committer

yewentao256

Parents

ae03f4c0

vllm 5b80f220 - [Perf] Optimize `reshape_and_cache` CUDA Kernel (#25955)

vllm
5b80f220 - [Perf] Optimize `reshape_and_cache` CUDA Kernel (#25955)