llama.cpp
68e02c0d - cuda : fix warp reduction initialization of shared mem

Commit

2 years ago

cuda : fix warp reduction initialization of shared mem

References

#4256 - ggml : add ggml_soft_max_ext

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

Loading