ho capito come "annullare" il RL e riportare gpt-oss a un modello di base rilascio i pesi domani buonanotte