llama.cpp
f1ac8411 - ggml-zendnn : add MUL_MAT_ID op support for MoE models (#21315)

Commit

3 days ago

ggml-zendnn : add MUL_MAT_ID op support for MoE models (#21315) * ggml-zendnn : add MUL_MAT_ID op support for MoE models - Add MUL_MAT_ID op acceleration for Mixture-of-Experts models - MUL_MAT_ID op fallback to CPU backend if total experts > 32 - Point ZenDNN lib to latest bits ZenDNN-2026-WW13 * ggml-zendnn : add braces to sgemm failure condition for consistency Co-authored-by: Aaron Teo <taronaeo@gmail.com> --------- Co-authored-by: Aaron Teo <taronaeo@gmail.com>

References

#21315 - ggml-zendnn : add MUL_MAT_ID op support for MoE models

Author

z-vishal

Parents

b069b10a

llama.cpp f1ac8411 - ggml-zendnn : add MUL_MAT_ID op support for MoE models (#21315)

llama.cpp
f1ac8411 - ggml-zendnn : add MUL_MAT_ID op support for MoE models (#21315)