llama : add qwen2moe (#6074)

Commit

2 years ago

llama : add qwen2moe (#6074) * support qwen2moe * fix-review * metal : support unary ops for nelements % 4 != 0 * metal : require contiguousness for float4 unary kernels * metal : require contiguousness for float4 unary kernels (cont) * fix-review * names : for brevity "SHARED_EXP" -> "SHEXP" * llama : reuse build_moe_ffn() * llama : add model type name --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

References

#6074 - Add qwen2moe

Author

simonJJJ

Parents

8a56075b

llama.cpp f4dea7da - llama : add qwen2moe (#6074)

llama.cpp
f4dea7da - llama : add qwen2moe (#6074)