transformers
e719b65c - Fix `FbgemmFp8Linear` not preserving tensor shape (#33239)

Commit

1 year ago

Fix `FbgemmFp8Linear` not preserving tensor shape (#33239) * add tests for linear shape behavior * fix linear shape behavior ended up adding the reshape at the end, after f8f8bf16_rowwise, because adding it directly after quantize_fp8_per_row caused f8f8bf16_rowwise to drop the seq_len dimension. (i.e., (17, 23, 1014) -> (17, 1024)) * save shape up front + comment

References

#33239 - Fix `FbgemmFp8Linear` not preserving tensor shape

Author

vgel

Parents

781bbc4d

transformers e719b65c - Fix `FbgemmFp8Linear` not preserving tensor shape (#33239)

transformers
e719b65c - Fix `FbgemmFp8Linear` not preserving tensor shape (#33239)