llama.cpp
8b20858e - perplexity : faster Winogrande via batching (#5024)

Commit

1 year ago

perplexity : faster Winogrande via batching (#5024) * perplexity : faster Winogrande via batching ggml-ci * perplexity : remove unused function * perplexity : only tokenize selected tasks for Winogrande

References

#5024 - perplexity : faster Winogrande via batching

Author

ggerganov

Parents

57e2a7a5

llama.cpp 8b20858e - perplexity : faster Winogrande via batching (#5024)

llama.cpp
8b20858e - perplexity : faster Winogrande via batching (#5024)