llama.cpp
0f98acfa - llama : add support for larger Granite Code Models (20B, 34B) (#7324)

Commit

2 years ago

llama : add support for larger Granite Code Models (20B, 34B) (#7324) Tie the weights for ARCH_STARCODER to support the larger Granite code models. Partially addresses ggerganov/issues/7116 There still remains to be a few things to fix. Currently requires `--override-kv tokenizer.ggml.add_bos_token=bool:false`

References

#7324 - Add support for larger Granite Code Models (20B, 34B)

Author

sroecker

Parents

ca57e0f3

llama.cpp 0f98acfa - llama : add support for larger Granite Code Models (20B, 34B) (#7324)

llama.cpp
0f98acfa - llama : add support for larger Granite Code Models (20B, 34B) (#7324)