La Thinking Machines, munca noastră include colaborarea cu comunitatea de cercetare mai largă. Astăzi suntem încântați să vă împărtășim că construim o echipă vLLM la @thinkymachines pentru a avansa vLLM open-source și pentru a servi modele de frontieră. Dacă sunteți interesați, vă rog să-mi trimiteți un mesaj sau să @barret_zoph! Iată câteva exemple de roluri/proiecte: * Inginer de inferență distribuită pentru a suporta modele la scară largă pe GPU-uri Blackwell * Inginer de optimizare a modelelor PyTorch pentru a suporta și optimiza cele mai recente modele OSS * MLSys generalist pentru diverse aspecte ale vLLM