onnxruntime
Support larger hidden size in Attention Cuda kernel
#7002

Merged

Support larger hidden size in Attention Cuda kernel #7002

gh-yewang merged 5 commits into master from wangye/hidden_size

Support larger hidden size in Attention Cuda kernel

16470401

gh-yewang requested a review 5 years ago

gh-yewang marked this pull request as draft 5 years ago

gh-yewang changed the title ~~(WIP)Support larger hidden size in Attention Cuda kernel~~ Support larger hidden size in Attention Cuda kernel 5 years ago

gh-yewang changed the title ~~Support larger hidden size in Attention Cuda kernel~~ (WIP)Support larger hidden size in Attention Cuda kernel 5 years ago

Update attention_transpose.cu

165c5fcf

gh-yewang requested a review from

tianleiwu 5 years ago

gh-yewang changed the title ~~(WIP)Support larger hidden size in Attention Cuda kernel~~ Support larger hidden size in Attention Cuda kernel 5 years ago

gh-yewang marked this pull request as ready for review 5 years ago

tianleiwu requested changes on 2021-03-15

tianleiwu commented on 2021-03-15

review comments

f2e84fcb

tianleiwu commented on 2021-03-15

fix typo and add check in quantization

f0d8d96a

gh-yewang requested a review from

tianleiwu 5 years ago

update readme

695f5b18

tianleiwu approved these changes on 2021-03-15

gh-yewang merged 4e670f7a into master 5 years ago

gh-yewang deleted the wangye/hidden_size branch 5 years ago

Reviewers

tianleiwu

Assignees

No one assigned

Labels

None yet

Milestone

No milestone

onnxruntime Support larger hidden size in Attention Cuda kernel #7002 Merged

Support larger hidden size in Attention Cuda kernel #7002

onnxruntime
Support larger hidden size in Attention Cuda kernel
#7002

Merged