Модель на основе DeepPavlov/distilrubert-tiny-cased-conversational-v1.
Статья, с которой все началось. Репозиторий ребят. Постарался упростить их реализацию.
Обучение происходило на датасете новостей Ленты.
Загрузка датасета:
python -m src.data_load.data_load --test_size=0.35Для запуска пайплайна обучения:
python -m src.model.train_model --epoch=2Для запуска с обученной моделью:
python -m src.model.predict