llama.cpp
62532c05 - cuda : do warp-based block reduce

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

2 years ago

cuda : do warp-based block reduce

References

#4256 - ggml : add ggml_soft_max_ext

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading