ochafik/llama.cpp

Pull Requests Commits

Update README.md

ochafik committed 2 years ago

d3180e70

agent: simpler agent2

ochafik committed 2 years ago

586cda18

agent: implement functionary v2 chat template

ochafik committed 2 years ago

1661f5c9

agent: format messages as json

ochafik committed 2 years ago

afa0340e

server: ultra basic tools, tool_choice, tool_calls support

ochafik committed 2 years ago

a1c4aac3

agent: support OpenAI: --endpoint https://api.openai.com --auth "Bearer $OPENAI_API_KEY"

ochafik committed 2 years ago

793f4ff3

openai: pretty indent json response

ochafik committed 2 years ago

a39e6e07

openai: make content optional for tool call grammar gen

ochafik committed 2 years ago

c8458fa5

Merge remote-tracking branch 'origin/master' into agent-example

ochafik committed 2 years ago

6dadcd25

`grammars`: fix resampling logic regression (#7424)

ochafik committed 2 years ago

Verified e402de36

CUDA: fix unused warning in mmq.cu (#7442)

JohannesGaessler committed 2 years ago

Verified fcf6538b

openai: fix merge

Olivier Chafik committed 2 years ago

5ea637e4

tests : test-tokenizer-0.sh print more info (#7402)

ggerganov committed 2 years ago

Verified c3f8d583

examples: cache hf model when --model not provided (#7353)

amirzia committed 2 years ago

Verified 11474e75

CUDA: deduplicate mmq code (#7397)

JohannesGaessler committed 2 years ago

Verified d8ee9022

Tokenizer SPM fixes for phi-3 and llama-spm (bugfix) (#7425)

jaime-m-p committed 2 years ago

Verified d7e852c1

Tokenizer SPM fixes for phi-3 and llama-spm (#7375)

jaime-m-p committed 2 years ago

Verified 917dc8cf

llama : remove Persimmon (#7408)

ggerganov committed 2 years ago

Verified fabf30b4

perplexity: update README FP16 results [no ci] (#7413)

JohannesGaessler committed 2 years ago

Verified 20385ceb

rpc : track allocated buffers (#7411)

rgerganov committed 2 years ago

Verified db10f013

server : fix temperature + disable some tests (#7409)

ggerganov committed 2 years ago

Verified 3bc10cb4

[SYCL] Update SYCL upscale operation (#7321)

AidanBeltonS committed 2 years ago

Verified 6bf9b66f

Update README.md (#7410)

binganao committed 2 years ago

Verified 26cd4237

ggml-opencl, llama: using reserve() if count already known (#7272)

GermanAizek committed 2 years ago

Verified 213e90ed

ggml : add loongarch lsx and lasx support (#6454)

junchao-loongson committed 2 years ago

Verified 65c58207

server : tuning tests (#7388)

ggerganov committed 2 years ago

Verified 1cc0155d

server : return error on too large embedding input (#7389)

ggerganov committed 2 years ago

Verified e932094d

tests : fix --keep_split -> --keep-split (#7374)

ggerganov committed 2 years ago

Verified 2789baf4

Add provisions for windows support for BF16 code including CMake provision for enabling AVX512_BF16 (#7258)

Srihari-mcw committed 2 years ago

Verified 33c8d50a

llama : remove MPI backend (#7395)

slaren committed 2 years ago

Verified d359f309

Older