Di Thinking Machines, pekerjaan kami mencakup kolaborasi dengan komunitas penelitian yang lebih luas. Hari ini kami dengan senang hati berbagi bahwa kami sedang membangun tim vLLM di @thinkymachines untuk memajukan vLLM sumber terbuka dan melayani model perbatasan. Jika Anda tertarik, silakan DM saya atau @barret_zoph! Berikut adalah beberapa contoh peran / proyek: * Insinyur inferensi terdistribusi untuk mendukung model skala besar pada GPU Blackwell * Insinyur pengoptimalan PyTorch & model untuk mendukung & mengoptimalkan model OSS terbaru * Generalis MLSys untuk berbagai aspek vLLM