llama.cpp
a3e6d622 - cuda : alternative q4_q8 kernel

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

2 years ago

cuda : alternative q4_q8 kernel

References

dequantize-matmul-3-gg

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading