llama : add PLaMo model (#3557)

Commit

2 years ago

llama : add PLaMo model (#3557) * add plamo mock * add tensor loading * plamo convert * update norm * able to compile * fix norm_rms_eps hparam * runnable * use inp_pos * seems ok * update kqv code * remove develop code * update README * shuffle attn_q.weight and attn_output.weight for broadcasting * remove plamo_llm_build_kqv and use llm_build_kqv * fix style * update * llama : remove obsolete KQ_scale * plamo : fix tensor names for correct GPU offload --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

References

#3557 - add PLaMo model

Author

okdshin

Parents

5bf3953d

llama.cpp 753be377 - llama : add PLaMo model (#3557)

llama.cpp
753be377 - llama : add PLaMo model (#3557)