whisper.cpp
f8c75dc4 - CUDA: fix crash on large batch size for MoE models (llama/13384)

Commit

232 days ago

CUDA: fix crash on large batch size for MoE models (llama/13384)

References

#3148 - sync : ggml

Author

JohannesGaessler

JohannesGaessler

Committer

ggerganov

ggerganov

Parents

Loading