分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

スタンフォード/Nvidiaの新しいTTT + RL論文の結果がどれほど驚異的か、人々はあまり気づいていないと思います。オープンソースモデルを訓練する際、 - Deepmind AlphaEvolveを破り、エルドスの最小重なり問題の新たな上限を発見 - 最高の人間のカーネルの2倍速い新しいA100 GPUカーネルを開発しました - AtCoderにおける最高のAIコーディングおよび人間の試みを上回る成績を収めましたテストタイムトレーニングの考え方は、モデルを反復的にタスクを解決しようとしながらトレーニングすることです。この論文で行われているように強化学習と組み合わせることで、継続的な学習の可能性が広がります著者:@mertyuksekgonul @LeoXinhaoLee @JedMcCaleb @xiaolonw @jankautz @YejinChoinka @james_y_zou @guestrin @sun_yu_

トップ

ランキング

お気に入り