llama.cpp
8a9aca37 - parallel : remove question with short answers

Commit

2 years ago

parallel : remove question with short answers

References

#3228 - llama : custom attention mask + parallel decoding + no context swaps

Author

ggerganov

ggerganov

Parents

Loading