llama.cpp
06dfde3e - llama : add basic support for offloading moe with CUDA

Commit

2 years ago

llama : add basic support for offloading moe with CUDA

References

#4406 - llama : add Mixtral support

Author

slaren

slaren

Committer

slaren

slaren

Parents

Loading