TextRL

на сайте с 27 марта 2023, 01:17

Text generation with reinforcement learning using huggingface's transformer. RLHF (Reinforcement Learning with Human Feedback) Implementation of ChatGPT for human interaction to improve generation model with reinforcement learning.

Скачать

^* Extension для Google Chrome

Разрабатывая это приложение я хотел бы чтобы любой мог найти похожие инструменты, технологии, техники и приёмы так же легко, как если бы вы искали в Google "Ruby vs ..." или "Awesome Ruby"

— Корнев Руслан (@woto)

Или воспользуйтесь нашим Телеграм ботом для добавления упоминаний.

Подробнее