llama.cpp
Fix Vulkan Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64
#8855

Merged

Fix Vulkan Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64 #8855

ggerganov merged 2 commits into master from 0cc4m/vulkan-fix-mmv-tests

Fix Vulkan mul mat vec invalid results when ncols < warp size

ecabd54d

Only run backend ops mul mat vec block size test if block size not al…

6c75cb95

github-actions added testing

0cc4m changed the title ~~0cc4m/vulkan fix mmv tests~~ Fix Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64 1 year ago

JohannesGaessler added Vulkan

0cc4m changed the title ~~Fix Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64~~ Fix Vulkan Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64 1 year ago

ggerganov approved these changes on 2024-08-05

ggerganov merged 064cdc26 into master 1 year ago

0cc4m deleted the 0cc4m/vulkan-fix-mmv-tests branch 1 year ago

Reviewers

ggerganov

Assignees

No one assigned

Labels

testing Vulkan

Milestone

No milestone

llama.cpp Fix Vulkan Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64 #8855 Merged

Fix Vulkan Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64 #8855

llama.cpp
Fix Vulkan Quantized Matrix Vector Multiplication on AMD GPUs when ncols < 64
#8855

Merged