RoastMe.ru (logo)

Corus

Corus — коллекция русскоязычных NLP-датасетов, на сайте с 22 декабря 2022, 06:31
Links to publicly available Russian corpora + code for loading and parsing. 20+ datasets, 350Gb+ of text.
  • http://natasha.github.io/corus
  • https://github.com/natasha/corus

Загружается...