transformers
08e3217b - Preserve requires_grad in pre quantized model (#37354)

Commit

292 days ago

Preserve requires_grad in pre quantized model (#37354) * Preserve requires_grad in pre quantized model Summary: discovered this when running lm-eval for some models, current code will set requires_grad to True always Test Plan: lm_eval --model hf --model_args pretrained=jerryzh168/phi4-torchao-gguf-q4_k --tasks hellaswag --device cuda:0 --batch_size 8 Reviewers: Subscribers: Tasks: Tags: * ruff format --------- Co-authored-by: Mohamed Mekkouri <93391238+MekkCyber@users.noreply.github.com>

References

#37354 - Preserve requires_grad in pre quantized model

Author

jerryzh168

Parents

4d0de5f7

transformers 08e3217b - Preserve requires_grad in pre quantized model (#37354)

transformers
08e3217b - Preserve requires_grad in pre quantized model (#37354)