transformers
b4456753 - [`NllbTokenizer`] refactor with added tokens decoder (#27717)

Commit

1 year ago

[`NllbTokenizer`] refactor with added tokens decoder (#27717) * refactor with addedtokens decoder * style * get rid of lang code to id * style * keep some things for BC * update tests * add the mask token at the end of the vocab * nits * nits * fix final tests * style * nits * Update src/transformers/models/nllb/tokenization_nllb_fast.py Co-authored-by: amyeroberts <22614925+amyeroberts@users.noreply.github.com> * nits * style? * Update src/transformers/convert_slow_tokenizer.py * make it a tad bit more custom * ruff please stop Co-Authored by avidale <dale.david@mail.ru> * Update Co-authored-by: avidale <dale.david@mail.ru> * Update Co-authored-by: avidale <dale.david@mail.ru> * oupts * ouft * nites * test * fix the remaining failing tests * style * fix failing test * ficx other test * temp dir + test the raw init * update test * style --------- Co-authored-by: amyeroberts <22614925+amyeroberts@users.noreply.github.com>

References

#27717 - [`NllbTokenizer`] refactor with added tokens decoder

Author

ArthurZucker

Parents

d90acc16

transformers b4456753 - [`NllbTokenizer`] refactor with added tokens decoder (#27717)

transformers
b4456753 - [`NllbTokenizer`] refactor with added tokens decoder (#27717)