llama.cpp
1ad42b1f - ggml : ggml_soft_max uses F16 mask

Login via GitHub
Home
Pricing
FAQ
Install

Login via GitHub

Commit

1 year ago

ggml : ggml_soft_max uses F16 mask

References

gg/flash-attn-mask-f16

Author

ggerganov

ggerganov

Committer

ggerganov

ggerganov

Parents

FAQ Terms Privacy Refunds Impressum

Loading