llama.cpp
1fb2658b - server: introduce self-speculative decoding

Commit

10 days ago

server: introduce self-speculative decoding

References

#18471 - Add self‑speculative decoding (no draft model required)

Author

srogmann

srogmann

Committer

srogmann

srogmann

Parents

Loading