onnxruntime
66254eb2 - Update BERT model optimization python script (#2521)

Commit

6 years ago

Update BERT model optimization python script (#2521) Add support of GPT2 model optimization: * Match subgraph of Gelu Approximation (using Tanh). * Fuse LayerNormalization if SkipLayerNormalization is not ready. * Output model even if embedding layer is not fused. * Improve Reshape Fusion to improve coverage. * Refine constant input checking, and output fused op counter. Update script according to latest op improvements: * Fusion of Add Bias and Gelu. * Fuse SkipLayerNormalization and Add Bias. Other: * Add ReduceSum for mask as intermediate step. * Refactor verbose setting.

References

#2521 - Update BERT model optimization python script

Author

tianleiwu

Parents

31ea11a6

onnxruntime 66254eb2 - Update BERT model optimization python script (#2521)

onnxruntime
66254eb2 - Update BERT model optimization python script (#2521)