llama : fix n_kv to never become 0 - SemanticDiff

Commit

2 years ago

llama : fix n_kv to never become 0

References

#3228 - llama : custom attention mask + parallel decoding + no context swaps

Author

ggerganov

ggerganov

Parents

Loading