ggml : online attention (CPU) - SemanticDiff

Commit

2 years ago

ggml : online attention (CPU)

References

gg/flash-attn-online

#5021 - ggml : add Flash Attention

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

Loading