llama.cpp
36375762 - server : disable speculative decoding for SWA models (#13970)

Commit

342 days ago

server : disable speculative decoding for SWA models (#13970) * server : use swa-full fo draft context ggml-ci * server : disable speculative decoding for SWA models

References

#13970 - server : disable speculative decoding for SWA models

Author

ggerganov

Parents

ea394d7a

llama.cpp 36375762 - server : disable speculative decoding for SWA models (#13970)

llama.cpp
36375762 - server : disable speculative decoding for SWA models (#13970)