llama.cpp
2c9380dd - Only one CUDA stream per device for async compute (#1898)

Commit

2 years ago

Only one CUDA stream per device for async compute (#1898)

References

#1898 - CUDA performance optimization: asynchronous computation by using only one cudaStream

Author

JohannesGaessler

JohannesGaessler

Parents

Loading