menemukan cara "membatalkan" RL dan mengubah gpt-oss kembali menjadi model dasar akan menurunkan beban besok Gn