Поиск
Все материалы
Language
API документация
Tinder
политика конфиденциальности
пользовательское соглашение
Вход / Регистрация
Open sidebar
TextRL
на сайте с March 27, 2023 01:17
Коллекции
История
Редактировать
Репорт
Text generation with reinforcement learning using huggingface's transformer. RLHF (Reinforcement Learning with Human Feedback) Implementation of ChatGPT for human interaction to improve generation model with reinforcement learning.
https://github.com/voidful/TextRL
Загружается...