PR #17808 server: improve speed of speculative decoding

server: improve speed of speculative decoding #17808

ngxson merged 9 commits into ggml-org:master from ngxson:xsn/server_improve_spec

server: improve speed of speculative decoding

f2f08f84

github-actions added examples

github-actions added server

fix small draft case

cac8d7b2

ngxson marked this pull request as ready for review 116 days ago

ngxson requested a review from

ggerganov 116 days ago

add link to the PR

398ae8db

server : fix generation time measurement

084cec95

server : fix draft acceptance logs (add SRV_CNT, SLT_CNT macros)

f74d1ee9

server : add comment

75be6ba0

ggerganov approved these changes on 2025-12-08

Merge branch 'master' into xsn/server_improve_spec

ba5c0b42

Merge branch 'master' into xsn/server_improve_spec

afe25301

add PR to docs

0a63bd80

ngxson merged f896d2c3 into master 114 days ago

Nindaleth commented on 2025-12-11

Reviewers

ggerganov

Nindaleth

Assignees

No one assigned

Labels

examples server

Milestone

No milestone