当前的机器人模型确实突显了人脑的高效程度。 机器人模型相对较小(低十亿参数),仅存储一秒的上下文,并进行100毫秒的推理步骤。 相比之下,人脑有100万亿个突触(大致相当于参数),以每秒24帧的速度处理,同时考虑数小时的先前上下文。 那么,我们如何期望在所有这些维度上(在推理计算方面相互权衡)同时获得数量级的改进呢? 我们又如何解释大脑中发生的事情?这更像是软件优势还是硬件优势? 与@svlevine的完整剧集现已上线!