PR #44231 [Performance] FP8 Grouped and Batched Matmuls

[Performance] FP8 Grouped and Batched Matmuls #44231

ArthurZucker merged 27 commits into main from fp8-grouped-mm

simplify

1984e5da

finegrained fp8 moe forwards

b1fcbd80

optimized fp8 fused, batched and grouped paths

12b05465

Merge branch 'main' into fp8-grouped-mm

f47040fe

fix

84e9ef21

wrap triton

94e4cd79

fix calls

98475580

fix

2aa637b5

Merge branch 'main' into fp8-grouped-mm

57e47798

remove fused quant kernel (litlle gain and unnecessary) and use torch…

125d8f4e

use kernels

a2e7dd12

fix

71a1b8c2

no need to wrap cutlass

5c33299d

IlyasMoutawwakil commented on 2026-02-26

cleanup

9212cc37

fix

ffe79316

Merge branch 'main' into fp8-grouped-mm

3b9e9f6c

Merge branch 'main' into fp8-grouped-mm

fef6f359

added non gated experts support

25aedb2c

remove comments

7e7e2ac7

style

6c6e1768

fix

4ab554db

IlyasMoutawwakil requested a review from

copilot-pull-request-reviewer 129 days ago

copilot-pull-request-reviewer commented on 2026-03-03

Update src/transformers/quantizers/quantizer_finegrained_fp8.py

8243a429

Update finegrained_fp8.py

77dde4e6

IlyasMoutawwakil marked this pull request as ready for review 129 days ago

per tensor scaling support

3802cd43

IlyasMoutawwakil requested a review from

SunMarc 127 days ago

IlyasMoutawwakil requested a review from

ArthurZucker 127 days ago

IlyasMoutawwakil requested a review from

Cyrilvallez 126 days ago

IlyasMoutawwakil requested a review from

vasqu 126 days ago

SunMarc approved these changes on 2026-03-05

Cyrilvallez approved these changes on 2026-03-09

ArthurZucker approved these changes on 2026-03-10

use custom fp8 interface

6fa940f0

document

eca2f01b

Merge branch 'main' into fp8-grouped-mm

c3107a90

SunMarc approved these changes on 2026-03-10

SunMarc enabled auto-merge 121 days ago

ArthurZucker merged ff2ba441 into main 121 days ago

ArthurZucker deleted the fp8-grouped-mm branch 121 days ago

Reviewers

SunMarc

ArthurZucker

Cyrilvallez

copilot-pull-request-reviewer

vasqu

Assignees

No one assigned

Labels

None yet

Milestone

No milestone

transformers [Performance] FP8 Grouped and Batched Matmuls #44231 Merged

[Performance] FP8 Grouped and Batched Matmuls #44231

transformers
[Performance] FP8 Grouped and Batched Matmuls
#44231

Merged