разобрался, как "отменить" RL и вернуть gpt-oss обратно в базовую модель завтра выложу веса спокойной ночи