llama.cpp
e536426d - llamafile : disable sgemm for batch-size 1 (#9330)

Commit

1 year ago

llamafile : disable sgemm for batch-size 1 (#9330)

References

#9330 - Only enable sgemm for prompt processing, not for inference

Author

netrunnereve

netrunnereve

Parents

Loading