llama.cpp
2f3a46fc - train : make KQ_pos memory buffer permanent via dummy scale op

Commit

2 years ago

train : make KQ_pos memory buffer permanent via dummy scale op

References

#3228 - llama : custom attention mask + parallel decoding + no context swaps

Author

ggerganov

ggerganov

Parents

Loading