llama.cpp
7474e00b - CUDA: fix crash with partial offloading of MoE (#13439)

Commit

1 year ago

CUDA: fix crash with partial offloading of MoE (#13439)

References

#13439 - CUDA: fix crash with partial offloading of MoE

Author

JohannesGaessler

JohannesGaessler

Parents

Loading