PR #10118 Q6_K AVX improvements

Q6_K AVX improvements #10118

slaren merged 10 commits into ggml-org:master from q6_k

q6_k instruction reordering attempt

499e9f2f

better subtract method

e3a34321

should be theoretically faster

0b75215f

optimize bit fiddling

a420e4cd

handle -32 offset separately. bsums exists for a reason!

35255d64

use shift

5b367158

Merge branch 'ggerganov:master' into q6_k

ed6f845a

Update ggml-quants.c

d84c372b

github-actions added ggml

slaren approved these changes on 2024-11-01

Merge branch 'ggerganov:master' into q6_k

4ec3e4a5

have to update ci macos version to 13 as 12 doesnt work now. 13 is st…

f85336e2

github-actions added devops

slaren merged 34073647 into master 1 year ago

netrunnereve deleted the q6_k branch 1 year ago

Reviewers

slaren

Assignees

No one assigned

Labels

devops ggml

Milestone

No milestone