intel/auto-round

Pull Requests Commits

disable packing immediate

yiliu30 committed 145 days ago

d95c7141

fix gpt-oss mem

yiliu30 committed 146 days ago

3842867b

yiliu30 committed 146 days ago

0354c2ba

yiliu30 committed 146 days ago

b992c319

root committed 146 days ago

2bd3c4b1

root committed 146 days ago

553ee5c8

root committed 147 days ago

a20f9df7

root committed 148 days ago

7a1716e0

Merge branch 'llmc' of https://github.com/intel/auto-round into llmc

yiliu30 committed 148 days ago

2f96c13f

yiliu30 committed 148 days ago

60a00232

yiliu30 committed 149 days ago

db65d74b

yiliu30 committed 149 days ago

361491f7

tmp wa for llmc

yiliu30 committed 151 days ago

8832530c

tmp wa for llmc

yiliu30 committed 151 days ago

ce985efc

enhance flux doc (#967)

mengniwang95 committed 151 days ago

Verified 7635f7ea

fix rtn bug (#966)

mengniwang95 committed 151 days ago

Verified c4ef9a82

fix bug of imatrix contains 0 (#955)

n1ck-guo committed 151 days ago

Verified 5e33cbce

[1/N] Initial vllm-ext evaluation support (MXFP4 MOE) (#935)

yiliu30 committed 152 days ago

Verified e8bc3536

fix critic disable_opt_rtn regression (#963)

wenhuach21 committed 152 days ago

Verified 282aab66

update readme (#962)

wenhuach21 committed 152 days ago

Verified 7d8016d9

mark round method as todo

yiliu30 committed 152 days ago

77844f6b

yiliu30 committed 152 days ago

ad8537c6

Merge branch 'main' into vllm-ext

yiliu30 committed 152 days ago

8f270411

refine AutoScheme readme/code (#958)

wenhuach21 committed 152 days ago

Verified 8ac82a4a

add logo (#960)

wenhuach21 committed 153 days ago

Verified eb2facd9

add self attribution and fix avg_bits error (#956)

xin3he committed 153 days ago

Verified 12c49846

Reduce AutoSchem VRAM usage by up to 10X (#944)

wenhuach21 committed 153 days ago

Verified 90c2fb4c

update gguf and support for CompressedLinear (#950)

n1ck-guo committed 153 days ago

Verified fbb9c13b

update readme for sglang support (#953)

WeiweiZhang1 committed 154 days ago

Verified 824a21fb

refactor utils file (#943)

n1ck-guo committed 154 days ago

Verified f1b5c72b

Older