llama.cpp
server: args for draft model cache types (#11200)
#13782

Merged

server: args for draft model cache types (#11200) #13782

ggerganov merged 1 commit into ggml-org:master from aa956:server-parameter-draft-cache-type

Adds server parameters for draft model cache type. Fixes ggml-org/lla…

0522270d

aa956 requested a review from

ngxson 1 year ago

github-actions added examples

github-actions added server

ggerganov approved these changes on 2025-05-30

ggerganov merged d67341dc into master 1 year ago

Reviewers

ggerganov

ngxson

Assignees

No one assigned

Labels

examples server

Milestone

No milestone