llama.cpp
8ee2a68d - grammar: reuse decoded tokens and pieces

Commit

2 years ago

grammar: reuse decoded tokens and pieces

References

grammar-speedup

Author

Olivier Chafik

Parents

Loading