當前的機器人模型確實突顯了人腦的高效程度。 機器人模型相對較小(低十億參數),僅存儲一秒的上下文,並進行100毫秒的推理步驟。 相比之下,人腦有100萬億個突觸(大致相當於參數),以每秒24幀的速度處理,同時考慮數小時的先前上下文。 那麼,我們如何期望在所有這些維度上(在推理計算方面相互權衡)同時獲得數量級的改進呢? 我們又如何解釋大腦中發生的事情?這更像是軟件優勢還是硬件優勢? 與@svlevine的完整劇集現已上線!