Physical Intelligence, en startup från San Francisco grundad 2024, utvecklar robotkontrollsystem som lär sig flera olika uppgifter med hjälp av visuella språk-handlingsmodeller härledda från stora språkmodeller. Företaget har demonstrerat robotar som utför varierade aktiviteter såsom att brygga kaffe, vika kläder och tillaga sötpotatis baserat på muntliga instruktioner.
I en lagermiljö har robotarna lärt sig att skala grönsaker, städa kök och hantera föremål i simulerade hemmiljöer som renoveras varje vecka. En nyligen framtagen modell vid namn π0.7 lyckades för första gången använda en airfryer efter att ha fått steg-för-steg-vägledning. Sergey Levine, en av grundarna och professor vid University of California, Berkeley, påpekade att varierade datakällor hjälper AI-system att förbättras snarare än att komplicera inlärningen. Företaget testar även robotar i faktiska hem för att hantera den variation som finns i verkliga miljöer. Ingmar Posner från University of Oxford beskrev tillvägagångssättet som en spännande tillämpning av språkmodellernas förmågor, men varnade för att storskalig implementering i verkligheten fortfarande ligger långt fram i tiden på grund av datakrav och oförutsägbara användarinteraktioner.