PR #2760 cuda : add RoPE kernel for mode == 2 (NeoX)

cuda : add RoPE kernel for mode == 2 (NeoX) #2760

ggerganov merged 2 commits into master from fix-falcon-cuda

cuda : add RoPE kernel for mode == 2 (NeoX)

ac4bb6ba

ggerganov requested a review from

slaren 2 years ago

ggerganov requested a review from

JohannesGaessler 2 years ago

ggerganov commented on 2023-08-24

JohannesGaessler commented on 2023-08-24

falcon : do not offload the embeddings layer

333e27b3

ggerganov merged 3f460a2b into master 2 years ago

ggerganov deleted the fix-falcon-cuda branch 2 years ago

Reviewers

JohannesGaessler

slaren

Assignees

No one assigned

Labels

None yet

Milestone

No milestone