llama.cpp
9ca2e677 - server : add speculative decoding support (#10455)

Commit

344 days ago

server : add speculative decoding support (#10455) * server : add speculative decoding support ggml-ci * server : add helper function slot.can_speculate() ggml-ci

References

#10455 - server : add speculative decoding support

Author

ggerganov

Parents

5931c1f2

llama.cpp 9ca2e677 - server : add speculative decoding support (#10455)

llama.cpp
9ca2e677 - server : add speculative decoding support (#10455)