llama.cpp
e95b6554 - ggml : add Q8_0 quantization for intermediate results (#951)

Commit

3 years ago

ggml : add Q8_0 quantization for intermediate results (#951) * ggml : add Q8_0 quantization for intermediate results * quantize-stats : fix test + add it to Makefile default * Q8: use int8_t, AVX/AVX2 optimizations * ggml : fix quantize_row_q8_0() ARM_NEON rounding * minor : updates after rebase to latest master * quantize-stats : delete obsolete strings * ggml : fix q4_1 dot func --------- Co-authored-by: Stephan Walter <stephan@walter.name>

References

#951 - Add Q8_0 quantization for intermediate results

Author

ggerganov

Parents

aa485cee

llama.cpp e95b6554 - ggml : add Q8_0 quantization for intermediate results (#951)

llama.cpp
e95b6554 - ggml : add Q8_0 quantization for intermediate results (#951)