llama.cpp
e3a2c3fe - server : use refs + use llama_batch_clear()

Commit

2 years ago

server : use refs + use llama_batch_clear()

References

#3677 - server : parallel decoding and multimodal (cont)

Author

ggerganov

ggerganov

Parents

Loading