descubrí cómo "deshacer" el RL y convertir gpt-oss de nuevo en un modelo base dejaré caer los pesos mañana gn