cuda : add f32 to bf16 copy op (#12806) - SemanticDiff

Commit

1 year ago

cuda : add f32 to bf16 copy op (#12806) This allows BF16 KV-cache on CUDA.

References

#12806 - cuda : add f32 to bf16 copy op

Author

CISC

CISC

Parents

Loading