ochafik/llama.cpp

Pull Requests Commits

fix typo (bool grammar no good!)

Olivier Chafik committed 1 year ago

eafd9577

llguidance build fixes for Windows (#11664)

mmoskal committed 1 year ago

Verified 89daa256

opencl: Fix rope and softmax (#11833)

lhez committed 1 year ago

Verified 300907b2

cuda : add ampere to the list of default architectures (#11870)

slaren committed 1 year ago

Verified 94b87f87

docker : drop to CUDA 12.4 (#11869)

ggerganov committed 1 year ago

Verified dbc2ec59

llama : add completion for --chat-template-file (#11860)

danbev committed 1 year ago

Verified 3d68f034

ggml: optimize some vec dot functions for LoongArch ASX (#11842)

MQ-mengqing committed 1 year ago

Verified 38e32eb6

vulkan: linux builds + small subgroup size fixes (#11767)

netrunnereve committed 1 year ago

Verified a4f011e8

llama-bench : fix unexpected global variable initialize sequence issue (#11832)

theraininsky committed 1 year ago

Verified a7b8ce22

ggerganov committed 1 year ago

Verified 04045bb8

llamafile: use member variable instead of constant for iq4nlt (#11780)

jmorganca committed 1 year ago

Verified 8a8c4ceb

server : (docs) Update wrong tool calling example (#11809)

RezaRahemtola committed 1 year ago

Verified c1f958c0

llama : add --completion-bash option (#11846)

danbev committed 1 year ago

Verified c48f630d

musa: bump MUSA SDK version to rc3.1.1 (#11822)

yeahdongcn committed 1 year ago

Verified bd6e55bf

`server`: fix tool-call of DeepSeek R1 Qwen, return reasoning_content (Command 7RB & DeepSeek R1) unless `--reasoning-format none` (#11607)

ochafik committed 1 year ago

Verified c7f460ab

sampling: add Top-nσ sampler (#11223)

VJHack committed 1 year ago

Verified 27e8a233

llama.cpp: fix warning message (#11839)

okuvshynov committed 1 year ago

Verified e4376270

llama : update llama_decode_internal ref [no ci] (#11840)

danbev committed 1 year ago

Verified 3e693197

ggml-cpu : add chunking support to mul_mat_id (#11666)

slaren committed 1 year ago

Verified a394039d

ggml : x2 speed for WASM by optimizing SIMD (#11453)

ngxson committed 1 year ago

Verified be3bbd62

server : (webui) Give copy button back to all message bubbles (#11814)

woof-dog committed 1 year ago

Verified 31afcbee

HIP: Remove GCN from list of devices that avoid MMQ (#11831)

IMbackK committed 1 year ago

Verified 5c4284d5

Fix: Compile failure due to Microsoft STL breaking change (#11836)

MrSMlT committed 1 year ago

Verified bfd11a23

ggerganov committed 1 year ago

Verified 0fb77f82

HIP: Switch to std::vector in rocblas version check (#11820)

IMbackK committed 1 year ago

Verified e598697d

cleanup: fix compile warnings associated with gnu_printf (#11811)

mtmcp committed 1 year ago

Verified fef0cbea

ggml : fix multi-threaded clamp_f32 (#11824)

Burton2000 committed 1 year ago

Verified 748ee9fe

ggml-cpu: Fix duplicate MATMUL_INT8 (#11817)

ownia committed 1 year ago

Verified 198b1ec6

CUDA: fix CUDART_VERSION checks (#11821)

JohannesGaessler committed 1 year ago

Verified c3d6af7c

llama : fix typo in llama-grammar.h [no ci] (#11816)

danbev committed 1 year ago

Verified 369be559

Older