> быть openAI, около 2017 года > проводить много интересных исследований > все с открытым исходным кодом > никому это не так уж и интересно > изобрести chatGPT в 2022 году > стать слишком занятыми, чтобы заниматься открытыми исследованиями > все сердятся > где открытые исследования > больше похоже на closedAI > проходит три года. теперь 2025 > наконец снова выпустить модель с открытым исходным кодом > 120B параметров, 5B активных (самая разреженная MOE, которую кто-либо когда-либо видел) > 4-битная квантизация (большинство людей даже не могут обучать в 8 бит) > тип данных MXFP4 (один год, на самом деле работает только на B200) > это GPT-OSS > снова полностью открытая модель > она слишком продвинута для нас > мы не можем ее использовать > тишина
163,03K