Teslas VP för AI, Ashok Elluswamy, har släppt en 30-minuters presentation som detaljerar framsteg i Full Self-Driving (FSD)-programvaran, AI-utveckling och teamets senaste innovationer. Föredraget hölls via International Conference on Computer Vision (ICCV) och belyser Teslas stora datatillgångar och nya simuleringsverktyg. Föredraget understryker ansträngningar mot global skalning av robotaxi och full autonomi för hela flottan.
I presentationen betonade Elluswamy Teslas oöverträffade datafördel, och uppgav att företagets fordonsflotta genererar '500 års kördata varje dag'. Han beskrev det som en 'Niagarafall av data', bestående av hundratals års kollektiv flotta-körning, fångad genom smarta datatriggers för sällsynta hörnfall som komplexa korsningar och oförutsägbart beteende. Detta tillvägagångssätt gör det möjligt för Tesla att extrahera endast väsentlig data för effektiv modellträning, och hantera 'dimensionens förbannelse' där åtta högframekamera producerar miljarder tokens per 30 sekunder av körkontext.
Trots det änd-till-ända neurala nätverkssystemet upprätthåller Tesla tolkbarhet för felsökning. Ingenjörer kan uppmana modellen att producera hjälpförutsägelser som 3D-ockupans, vägbounds, objekt, skyltar och trafikljus, som inte styr fordonet men hjälper säkerhetskontroller. Naturlig språkfråga möjliggör frågor som varför ett visst beslut togs. Dessutom utvecklade Tesla ett anpassat, ultrsnabbt Gauss-splattningssystem för att rekonstruera skarpa 3D-scener från begränsade kameravyer, som överträffar standard NeRF- och splattningsmetoder för visuell felsökning.
Utvärdering förblir en nyckeltal, med modeller som utmärker sig offline men kämpar i verkliga världens kantfall. För att motverka detta skapade Tesla en lärd världs-simulator – ett neuralt nätverks-genererat video-motor som simulerar åtta Tesla-kameramatar simultant i helt syntetiska miljöer. Det stödjer testning, träning, förstärkningsinlärning, injektion av motståndshändelser (t.ex. en fotgängare som skär in), och uppspelning av tidigare misslyckanden, och kör nära realtid för simulerade körningar.
Ser framåt, beskrev Elluswamy planer för att skala robotaxi-tjänster globalt, uppnå full autonomi över hela Tesla-flottan, och introducera Cybercab – ett nästagenerations tvåsitsigt fordon optimerat för robotaxi-användning, med mål för transportkostnader lägre än kollektivtrafik. Samma neurala nätverk kommer att driva den humanoide roboten Optimus, med video-genereringssystemet nu tillämpat för att simulera och planera robotrörelser.