llama.cpp
a9681feb - ggml : online attention (CPU)

Commit

1 year ago

ggml : online attention (CPU)

References

gg/flash-attn-online

#5021 - ggml : add Flash Attention

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

Files6

ggml-metal.m
ggml-metal.metal
ggml.c
ggml.h
llama.cpp
tests
- test-backend-ops.cpp