Мне кажется диким, что модели робототехники @physical_int могут работать вообще, учитывая, что у них всего 1 секунда контекста. Когда робот перемещается по комнате и убирает со стола, он видит только текущее время изображений с камер (плюс текстовое описание своей задачи). Я спросил @svlevine, как эта модель может работать вообще. Если бы человеку нужно было выполнить план, который длится много минут, чтобы осуществить физическую задачу, но при этом его память сбрасывалась бы каждую секунду, он бы не смог это сделать. Но, тем не менее, просто зная, в каком состоянии мир находится в этот самый момент, достаточно, чтобы поддерживать разумно сложный план? Ответ Сергея ссылается на Парадокс Моровека, и мне это показалось довольно интересным. Полный эпизод выйдет завтра!