llama.cpp
b3964c1e - metal : optimize FA vec for large sequences and BS <= 8 (#15566)

Commit

268 days ago

metal : optimize FA vec for large sequences and BS <= 8 (#15566) * metal : optmize FA vec for large heads and sequences * metal : adjust small-batch mul mv kernels ggml-ci * batched-bench : fix total speed computation ggml-ci * cont : add comments ggml-ci

References

#15566 - metal : optimize FA vec for large sequences and BS <= 8

Author

ggerganov

Parents

79a54622

llama.cpp b3964c1e - metal : optimize FA vec for large sequences and BS <= 8 (#15566)

llama.cpp
b3964c1e - metal : optimize FA vec for large sequences and BS <= 8 (#15566)