llama.cpp
2e6cd4b0 - OpenCL Token Generation Acceleration (#1459)

Commit

2 years ago

OpenCL Token Generation Acceleration (#1459) * Move back to C++ for OpenCL * Refactor OpenCL code to work more like the CUDA code, add missing functions * Deduplicate dequant kernels * Add OpenCL compile options * Use compile args for preprocessing constants * Restore default platform + device selection by id behavior --------- Co-authored-by: Johannes Gäßler <johannesg@5d6.de> Co-authored-by: Henri Vasserman <henv@hot.ee>

References

#1459 - OpenCL dequant_mul_mat

Author

0cc4m

Parents

7e4ea5be

llama.cpp 2e6cd4b0 - OpenCL Token Generation Acceleration (#1459)

llama.cpp
2e6cd4b0 - OpenCL Token Generation Acceleration (#1459)