DeepSpeed
Fix llama meta tensor loading in AutoTP and kernel injected inference
#3608

Merged

Fix llama meta tensor loading in AutoTP and kernel injected inference #3608

lekurile merged 16 commits into deepspeedai:master from zeyugao:master

zeyugao requested a review from

RezaYazdaniAminabadi 3 years ago

zeyugao requested a review from

jeffra 3 years ago

zeyugao requested a review from

mrwyattii 3 years ago

zeyugao requested a review from

awan-10 3 years ago

zeyugao requested a review from

cmikeh2 3 years ago

zeyugao requested a review from

arashb 3 years ago

Adapt to Llama when using meta tensor to load

d66ae982

Fix gated mlp parameter mp

5d1fcf42

zeyugao force pushed from b29ef812 to 5d1fcf42 3 years ago

zeyugao changed the title ~~Adapte to Llama when using meta tensor to load~~ Fix llama meta tensor loading, model tensor parallelism inference 3 years ago

Re-enable meta tensor for kernel injection

f8ce148d

Merge branch 'master' into master

fe0512fc

Merge remote-tracking branch 'origin/master' into pr-master

779bbc3e

zeyugao changed the title ~~Fix llama meta tensor loading, model tensor parallelism inference~~ Fix llama meta tensor loading in AutoTP and kernel injected inference 3 years ago

Revert mlp_inter_mp for gated mlp as it is fixed

eb695312

Merge remote-tracking branch 'origin/master' into pr-master

02309b50

Monkey patch for fixing llama output

3f684cb5

zeyugao closed this 2 years ago

zeyugao force pushed from eb695312 to 9d79cfd1 2 years ago

zeyugao reopened this 2 years ago

Merge branch 'master' of https://github.com/zeyugao/DeepSpeed into ze…

9fbd189a

t push origin masterMerge branch 'zeyugao-master'

166469cb

Merge branch 'master' of https://github.com/microsoft/DeepSpeed

e35f460b

Fix formatting

f2f92fe9

Merge branch 'master' into master

07ac3c7d

Merge branch 'master' into master

a98e6463

lekurile enabled auto-merge 2 years ago

Add comment

f51feaee

Merge branch 'master' of https://github.com/zeyugao/DeepSpeed

0a5dd861

lekurile approved these changes on 2023-09-20

lekurile merged 4fc2c8e7 into master 2 years ago

Reviewers

lekurile

RezaYazdaniAminabadi

jeffra

mrwyattii

awan-10

cmikeh2

arashb

Assignees

No one assigned

Labels

None yet

Milestone

No milestone

DeepSpeed Fix llama meta tensor loading in AutoTP and kernel injected inference #3608 Merged

Fix llama meta tensor loading in AutoTP and kernel injected inference #3608

DeepSpeed
Fix llama meta tensor loading in AutoTP and kernel injected inference
#3608

Merged