whisper.cpp
2d70cd36 - CUDA: optimize FA for GQA + large batches (llama/12014)

Commit

334 days ago

CUDA: optimize FA for GQA + large batches (llama/12014)

References

#2844 - sync : ggml

Author

JohannesGaessler

JohannesGaessler

Committer

ggerganov

ggerganov

Parents

Loading