llama.cpp
8125e6cb - server : don't overfill the batch during infill (#10018)

Commit

1 year ago

server : don't overfill the batch during infill (#10018) ggml-ci

References

#10018 - server : don't overfill the batch during infill

Author

ggerganov

ggerganov

Parents

Loading