cuda : add F32 sgemm branch - SemanticDiff

Commit

2 years ago

cuda : add F32 sgemm branch

References

#3776 - cuda : improve text-generation and batched decoding performance

Author

ggerganov

ggerganov

Parents

Loading