llama.cpp
10+% performance improvement of ggml_vec_dot_q4_0 on AVX2
#654

Merged

10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 #654

sw merged 3 commits into ggml-org:master from SebastianApel:performance_improvement_q4_0_AVX2

SebastianApel changed the title ~~~1.5x performance improvement of ggml_vec_dot_q4_0 on AVX2~~ 10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 2 years ago

ggerganov commented on 2023-04-02

sw commented on 2023-04-02

SebastianApel force pushed 2 years ago

SebastianApel requested a review from

sw 2 years ago

SebastianApel force pushed 2 years ago

Performance improvement of AVX2 code

69ef03d5

SebastianApel force pushed to 69ef03d5 2 years ago

sw commented on 2023-04-02

Fixed problem with MSVC compiler

b589e34f

Reviewer comments: removed double semicolon, deleted empty line 1962

1ed8878a

SebastianApel requested a review from

sw 2 years ago

sw approved these changes on 2023-04-03

sw merged 437e7785 into master 2 years ago

Reviewers

ggerganov

Assignees

No one assigned

Labels

None yet

Milestone

No milestone

llama.cpp 10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 #654 Merged

10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 #654

llama.cpp
10+% performance improvement of ggml_vec_dot_q4_0 on AVX2
#654

Merged