llama.cpp
946796fc - ggml-cuda : slight optimizations for TQ2_0

Commit

1 year ago

ggml-cuda : slight optimizations for TQ2_0 Co-authored-by: Johannes Gäßler <johannesg@5d6.de>

References

Author

compilade

Committer

compilade

Parents