llama.cpp
61a88a1d - llama : fix BERT inference without KV cache

Commit

1 year ago

llama : fix BERT inference without KV cache

References

#7531 - llama : support Jamba hybrid Transformer-Mamba models

Author

compilade

compilade

Parents

Loading