llama.cpp
8faa1d4d - CUDA: faster non-contiguous concat (#10760)

Commit

1 year ago

CUDA: faster non-contiguous concat (#10760) * faster uncontiguous concat * Use a lambda to avoid code duplication Co-authored-by: Diego Devesa <slarengh@gmail.com> * Update ggml/src/ggml-cuda/concat.cu * add constexpr and static assert --------- Co-authored-by: Diego Devesa <slarengh@gmail.com>

References

#10760 - [backend](cuda): faster uncontiguous concat

Author

A3shTnT

Parents

cb13ef85

llama.cpp 8faa1d4d - CUDA: faster non-contiguous concat (#10760)

llama.cpp
8faa1d4d - CUDA: faster non-contiguous concat (#10760)