fant ut hvordan jeg kunne "angre" RL og gjøre gpt-oss tilbake til en basismodell vil slippe vektene i morgen Gn
Jack Morris
Jack Morris9. aug. 2025
nysgjerrig på treningsdataene til OpenAIs nye gpt-oss-modeller? Det var jeg også. så jeg genererte 10 millioner eksempler fra gpt-oss-20b, kjørte noen analyser, og resultatene var ... ganske bisarrt På tide med et dypdykk 🧵
195,61K