Megatron-DeepSpeed
Checking we use fused kernels to compute scaled masked softmax on prefix lm
#209

Merged

Checking we use fused kernels to compute scaled masked softmax on prefix lm #209

thomasw21 merged 3 commits into main from thomas/improve_test_to_test_custom_kernel

WIP

46d5c334

Turns out there's no issue with the way we build prefix lm

e7a12e73

Lint

16ed6211

thomasw21 changed the title ~~[WIP] Checking when we use fused kernels to compute scaled masked softmax~~ Checking we use fused kernels to compute scaled masked softmax on prefix lm 4 years ago

thomasw21 marked this pull request as ready for review 4 years ago

thomasw21 merged b227590f into main 4 years ago

Reviewers

No reviews

Assignees

No one assigned

Labels

None yet

Milestone

No milestone

Megatron-DeepSpeed Checking we use fused kernels to compute scaled masked softmax on prefix lm #209 Merged

Checking we use fused kernels to compute scaled masked softmax on prefix lm #209

Megatron-DeepSpeed
Checking we use fused kernels to compute scaled masked softmax on prefix lm
#209

Merged