ochafik/llama.cpp

Pull Requests Commits

[no ci] docs: add aikit to readme (#7650)

sozercan committed 2 years ago

Verified 0541f062

Fixed painfully slow single process builds. (#7326)

jboero committed 2 years ago

Verified 9022c336

llama : cache llama_token_to_piece (#7587)

ggerganov committed 2 years ago

Verified 5921b8f0

Fix conan badge display [no ci] (#7645)

MartinDelille committed 2 years ago

Verified 5dcdf946

Add brew installation instruction to README [no ci] (#7616)

makuche committed 2 years ago

Verified 2e2340de

readme : add Conan badge (#7638)

MartinDelille committed 2 years ago

Verified 7846540b

github: add contact links to issues and convert question into research [no ci] (#7612)

mofosyne committed 2 years ago

Verified e6157f94

Move convert.py to examples/convert-legacy-llama.py (#7430)

Galunid committed 2 years ago

Verified 9c4c9cc8

faster avx512 exp implementation (#7551)

chriselrod committed 2 years ago

Verified 59b0d077

ggml : fix loongarch build (O2 issue) (#7636)

junchao-loongson committed 2 years ago

Verified d5c05821

README: explain parallel build [no ci] (#7618)

JohannesGaessler committed 2 years ago

Verified 972b555a

[SYCL] fix intel docker (#7630)

airMeng committed 2 years ago

Verified 3854c9d0

gguf-py : Add tokenizer.ggml.pre to gguf-new-metadata.py (#7627)

Galunid committed 2 years ago

Verified eb57fee5

metal : remove invalid asserts (#7617)

ggerganov committed 2 years ago

Verified 55d62262

metal : add missing asserts (#7617)

ggerganov committed 2 years ago

Verified 975ec63f

ggml : fix YARN + add tests + add asserts (#7617)

ggerganov committed 2 years ago

Verified fb76ec31

cuda : non-cont concat support (#7610)

ggerganov committed 2 years ago

Verified cce3dcff

llama-bench : add support for the RPC backend (#7435)

rgerganov committed 2 years ago

Verified 210d9917

ggml : use atomic_flag for critical section (#7598)

slaren committed 2 years ago

Verified 87bdf2a1

scripts : remove mpi remnants

ggerganov committed 2 years ago

Verified 00281b7b

ggerganov committed 2 years ago

Verified 2ab97728

ggml : restore ggml_rope_xpos_inplace (ggml/0)

ggerganov committed 2 years ago

Verified 72de268b

Add Arc A750 and Arch linux to readme-sycl.md as verified GPU model and Linux distro (#7605)

Akarshan Biswas committed 2 years ago

Verified 0e8d8bfd

ggml : fix typo in ggml.c (#7603)

zhouwg committed 2 years ago

Verified 504f0c34

[SYCL] Align GEMM dispatch (#7566)

airMeng committed 2 years ago

Verified b864b50c

Tokenizer WPM fixes (#7500)

jaime-m-p committed 2 years ago

Verified 02c1ecad

sycl : fix assert (#7563)

ggerganov committed 2 years ago

Verified 6bd12ce4

llama : support small Granite models (#7481)

giuseppe committed 2 years ago

Verified 5442939f

vulkan: properly initialize vulkan devices for LLAMA_SPLIT_MODE_NONE (#7552)

Adriankhl committed 2 years ago

Verified 56411a95

rpc : resource management rework (#7562)

rgerganov committed 2 years ago

Verified 2b737caa

Newer Older