ggml
ff54fda8 - gpt-2 : loading Q4_0 quantized model

Commit

3 years ago

gpt-2 : loading Q4_0 quantized model

References

#27 - 4-bit Integer quantisation

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

Loading