المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
لا أعتقد أن الناس أدركوا مدى جنون النتائج من هذه الورقة الجديدة TTT + RL من ستانفورد/نفيديا.
تدريب نموذج مفتوح المصدر، هم
- تجاوز Deepmind AlphaEvolve، واكتشاف حد أعلى جديد لمشكلة التداخل الأدنى لدى إردوس
- طور نوى جديدة لمعالج الرسوميات A100 أسرع بمرتين من أفضل نواة بشرية
- تفوق على أفضل محاولة ترميز الذكاء الاصطناعي وأفضل محاولة بشرية على AtCoder
فكرة تدريب وقت الاختبار هي تدريب نموذج *بينما* يحاول حل مهمة بشكل متكرر. دمج هذا مع التعلم الواقعي كما في هذه الورقة يفتح أبواب الإمكانيات للتعلم المستمر
المؤلفون: @mertyuksekgonul @LeoXinhaoLee @JedMcCaleb @xiaolonw @jankautz @YejinChoinka @james_y_zou @guestrin @sun_yu_

الأفضل
المُتصدِّرة
التطبيقات المفضلة
