llama.cpp
f66f5829 - llama : refactor `src/llama.cpp` (#10902)

Commit

189 days ago

llama : refactor `src/llama.cpp` (#10902) * llama : scatter llama.cpp into multiple modules (wip) * llama : control-vector -> adapter * llama : arch * llama : mmap ggml-ci * ci : remove BUILD_SHARED_LIBS=OFF ggml-ci * llama : arch (cont) ggml-ci * llama : chat ggml-ci * llama : model ggml-ci * llama : hparams ggml-ci * llama : adapter ggml-ci * examples : fix ggml-ci * rebase ggml-ci * minor * llama : kv cache ggml-ci * llama : impl ggml-ci * llama : batch ggml-ci * cont ggml-ci * llama : context ggml-ci * minor * llama : context (cont) ggml-ci * llama : model loader ggml-ci * common : update lora ggml-ci * llama : quant ggml-ci * llama : quant (cont) ggml-ci * minor [no ci]

References

#10902 - llama : refactor `src/llama.cpp`

Author

ggerganov

Parents

2f0ee84b

Files61

.github/workflows
- build.yml
common
- arg.cpp
- common.cpp
- common.h
examples
- convert-llama2c-to-ggml
  - convert-llama2c-to-ggml.cpp
- cvector-generator
  - cvector-generator.cpp
- embedding
  - embedding.cpp
- eval-callback
  - eval-callback.cpp
- gguf-split
  - gguf-split.cpp
- imatrix
  - imatrix.cpp
- infill
  - infill.cpp
- lookahead
  - lookahead.cpp
- lookup
  - lookup-create.cpp
  - lookup-stats.cpp
  - lookup.cpp
- main
  - main.cpp
- parallel
  - parallel.cpp
- perplexity
  - perplexity.cpp
- quantize-stats
  - quantize-stats.cpp
- retrieval
  - retrieval.cpp
- save-load-state
  - save-load-state.cpp
- server
  - server.cpp
  - utils.hpp
- speculative-simple
  - speculative-simple.cpp
- speculative
  - speculative.cpp
- tts
  - tts.cpp
include
- llama-cpp.h
- llama.h
src
- CMakeLists.txt
- llama-adapter.cpp
- llama-adapter.h
- llama-arch.cpp
- llama-arch.h
- llama-batch.cpp
- llama-batch.h
- llama-chat.cpp
- llama-chat.h
- llama-context.cpp
- llama-context.h
- llama-cparams.cpp
- llama-cparams.h
- llama-grammar.cpp
- llama-grammar.h
- llama-hparams.cpp
- llama-hparams.h
- llama-impl.cpp
- llama-impl.h
- llama-kv-cache.cpp
- llama-kv-cache.h
- llama-mmap.cpp
- llama-mmap.h
- llama-model-loader.cpp
- llama-model-loader.h
- llama-model.cpp
- llama-model.h
- llama-quant.cpp
- llama-quant.h
- llama-sampling.cpp
- llama-vocab.cpp
- llama-vocab.h
- llama.cpp

llama.cpp f66f5829 - llama : refactor `src/llama.cpp` (#10902)

llama.cpp
f66f5829 - llama : refactor `src/llama.cpp` (#10902)