intel/auto-round

Pull Requests Commits

wenhuach21 committed 1 year ago

5632f001

wenhuach21 committed 1 year ago

c322bc06

wenhuach21 committed 1 year ago

aa0b4d5c

wenhuach21 committed 1 year ago

494d9d0e

wenhuach21 committed 1 year ago

a9a001d3

add thread limits for packing by following autogptq

wenhuach21 committed 1 year ago

b060e12d

wenhuach21 committed 1 year ago

a176b829

wenhuach21 committed 1 year ago

4d2225eb

wenhuach21 committed 1 year ago

12c3e5fa

support marlin in auto_round format (#172)

wenhuach21 committed 1 year ago

Verified 2b1448d4

wenhuach21 committed 1 year ago

9bda2430

wenhuach21 committed 1 year ago

4142b498

fix default_value issue of seqlen and nsample

yintong-lu committed 1 year ago

4b105cfd

wenhuach21 committed 1 year ago

a1d0bbc3

add thread limits for packing by following autogptq

wenhuach21 committed 1 year ago

05687b5f

wenhuach21 committed 1 year ago

5dc8cb64

wenhuach21 committed 1 year ago

1050a14f

wenhuach21 committed 1 year ago

4c442bcf

revert the gptq format code to fix the regression (#168)

wenhuach21 committed 1 year ago

Verified 5947e9c0

fix typos, update overview img (#166)

WeiweiZhang1 committed 1 year ago

Verified 8d5765ac

1 fix a bug in autoround format with the latest transformers 2 rename n_samples n_blocks to nsamples nblocks (#163)

wenhuach21 committed 1 year ago

Verified f9e7d79e

WeiweiZhang1 committed 1 year ago

Verified 31c566cc

fix bug and limit numpy version (#159)

yintong-lu committed 1 year ago

Verified 77320b0a

support calibration dataset concat (#147)

yintong-lu committed 1 year ago

Verified 75e3fde0

remove gpt ppl eval from lm-0.4.2 (#158)

wenhuach21 committed 1 year ago

Verified 77d6a886

fix bug at whole block is excluded from quantization (#156)

wenhuach21 committed 1 year ago

Verified edcec56e

auto round quantizer supports gptq kernel (#155)

wenhuach21 committed 1 year ago

Verified 9cae103d

fix qbits issue (#153)

wenhuach21 committed 1 year ago

Verified c313fa33

Qbits related log (#151)

zhewang1-intc committed 1 year ago

Verified 34274fb3

autoround_support_qbits_backend (#145)

zhewang1-intc committed 1 year ago

Verified dbdc4a39

Older