Uważam, że to szalone, że modele robotyki @physical_int mogą w ogóle działać, biorąc pod uwagę, że mają tylko 1-sekundową długość kontekstu. Gdy robot porusza się po pokoju i sprząta stół, widzi tylko aktualny znacznik czasu obrazów z kamer (plus opis tekstowy swojego zadania). Zapytałem @svlevine, jak ten model może w ogóle działać. Gdyby człowiek musiał wykonać plan trwający wiele minut, aby zrealizować fizyczne zadanie, ale co sekundę miałby resetowaną pamięć, nie byłoby szans, żeby mu się to udało. Ale w jakiś sposób wiedza o tym, w jakim stanie dosłownie znajduje się świat w tej chwili, to wszystko, co musisz wiedzieć, aby kontynuować dość skomplikowany plan? Odpowiedź Sergeya odnosi się do paradoksu Morevaca i uznałem to za dość interesujące. Pełny odcinek jutro!