llama.cpp
99bd4ac2 - llama : infill sampling handle very long tokens (#9924)

Commit

327 days ago

llama : infill sampling handle very long tokens (#9924) * llama : infill sampling handle very long tokens ggml-ci * cont : better indices ggml-ci

References

Author

ggerganov

Parents