PR #7188 CUDA: add FP32 FlashAttention vector kernel

CUDA: add FP32 FlashAttention vector kernel

JohannesGaessler committed 2 years ago

fixup! CUDA: add FP32 FlashAttention vector kernel

JohannesGaessler committed 2 years ago

fixup! fixup! CUDA: add FP32 FlashAttention vector kernel

JohannesGaessler committed 2 years ago

fixup! fixup! fixup! CUDA: add FP32 FlashAttention vector kernel

JohannesGaessler committed 2 years ago

llama.cpp CUDA: add FP32 FlashAttention vector kernel #7188 Merged