トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
スタンフォード/Nvidiaの新しいTTT + RL論文の結果がどれほど驚異的か、人々はあまり気づいていないと思います。
オープンソースモデルを訓練する際、
- Deepmind AlphaEvolveを破り、エルドスの最小重なり問題の新たな上限を発見
- 最高の人間のカーネルの2倍速い新しいA100 GPUカーネルを開発しました
- AtCoderにおける最高のAIコーディングおよび人間の試みを上回る成績を収めました
テストタイムトレーニングの考え方は、モデルを反復的にタスクを解決しようとしながらトレーニングすることです。この論文で行われているように強化学習と組み合わせることで、継続的な学習の可能性が広がります
著者:@mertyuksekgonul @LeoXinhaoLee @JedMcCaleb @xiaolonw @jankautz @YejinChoinka @james_y_zou @guestrin @sun_yu_

トップ
ランキング
お気に入り
