llama.cpp
6272b676 - use stride=128 if built for tensor cores

Commit

2 years ago

use stride=128 if built for tensor cores

References

ceb/perf-faster-multigpu

Author

cebtenzzre

cebtenzzre

Parents

Loading