onnxruntime
fe4b6550 - [WebNN] Improve MultiHeadAttention op implementation (#27494)

Commit

133 days ago

[WebNN] Improve MultiHeadAttention op implementation (#27494) - Remove additional FP32 cast nodes and let underlayer backends to handle the precision issues - Fix a bug when checking tensor existence for the attention_bias input - Some other minor improvements

References

#27494 - [WebNN] Improve MultiHeadAttention op implementation

Author

Honry

Parents

763abb9d

onnxruntime fe4b6550 - [WebNN] Improve MultiHeadAttention op implementation (#27494)

onnxruntime
fe4b6550 - [WebNN] Improve MultiHeadAttention op implementation (#27494)