Google presenterar TPU 8t- och TPU 8i-chip för agentisk AI

22 april 2026

Rapporterad av AI

Google har introducerat två nya Tensor Processing Units, TPU 8t för träning och TPU 8i för inferens, inriktade på vad företaget kallar AI:s agentiska era. Dessa åttonde generationens chip följer efter Ironwood TPU från 2025 och lovar snabbare och mer effektiv AI-utveckling. Hårdvaran syftar till att korta ner träningstiderna för stora modeller från månader till veckor.

Google tillkännagav TPU 8t och TPU 8i på tisdagen och positionerade dem som specialiserade acceleratorer för olika skeden i AI-modellernas livscykler. TPU 8t fokuserar på träning av gränsöverskridande modeller med uppdaterade serverkluster som kallas pods, vilka rymmer 9 600 chip och två petabyte delat minne med hög bandbredd. Google uppger att dessa pods levererar 121 FP4 EFlops beräkningskapacitet, nästan tre gånger högre än den föregående Ironwood-generationen, och att de kan skalas linjärt till en miljon chip i ett enda kluster. Företaget hävdar en "goodpute"-grad på 97 procent tack vare förbättrad minneshantering, automatisk felhantering och telemetri i realtid över alla chip, vilket minskar spilltid och ansträngning. Träningstiderna för massiva AI-modeller förväntas enligt Google sjunka från månader till veckor. TPU 8i hanterar inferens, fasen där tränade modeller genererar svar. Dessa chip arbetar i större pods om 1 152 enheter och tillhandahåller 11,6 EFlops per pod. Varje TPU 8i har tre gånger så mycket SRAM på chippet, totalt 384 MB, vilket möjliggör större key-value-cachar för modeller med utökade kontextfönster. För första gången paras chippen uteslutande ihop med Googles egna Axion ARM-processorer, med en CPU per två TPU:er, vilket Google menar ökar den totala effektiviteten jämfört med den tidigare x86-konfigurationen som servade fyra TPU:er. Effektivitetsvinsterna sträcker sig även till strömförbrukning och kylning. De nya TPU:erna erbjuder dubbelt så hög prestanda per watt jämfört med Ironwood, medan datacenterdesigner som integrerar nätverk och beräkning har ökat beräkningskraften per elektrisk enhet sexfaldigt. Vätskekylningen använder nu aktivt styrda ventiler för att anpassa vattenflödet efter arbetsbelastningen. Dessa chip kommer att stödja Googles Gemini-baserade agenter samt tredjepartsutvecklare via ramverk som JAX, MaxText, PyTorch, SGLang och vLLM. Nvidias aktie sjönk kortvarigt med 1,5 procent efter nyheten men återhämtade sig.

Relaterade artiklar

Illustration of OpenAI's GPT-5.4 launch, showing enhanced AI models for knowledge work in a modern office setting amid competition.

OpenAI releases GPT-5.4 models for knowledge work

6 mars 2026 Rapporterad av AI Bild genererad av AI

OpenAI has launched GPT-5.4, including variants Thinking and Pro, aimed at improving agentic tasks and knowledge work. The update features enhanced computer-use capabilities and reduced factual errors, amid competition from Anthropic following a US defense deal controversy. The models are available immediately to paid users and developers.

Experts suggest physical AI could lead to AGI

Experts argue that physical AI, involving robots and autonomous machines interacting with the real world, may provide a direct path to artificial general intelligence. Elon Musk's comments on Tesla's Optimus robots highlight this potential, amid growing investments in related technologies. The year 2026 is seen as a key inflection point for the field.

Tesla details AI chip tech and Optimus goals in robotics pivot

23 februari 2026 Rapporterad av AI

Building on last week's earnings report announcing the shift from EVs to AI and robotics, Tesla has outlined specifics on its custom AI5 and AI6 chips, next-gen Optimus robot, and ambitious 'general solution' for self-driving and bipedal robotics. The $20 billion 2026 investment underscores this transformation amid ongoing EV challenges.

Teknik

TSMC faces growing foundry competition amid AI demand

Teknik

Google announces Gemini 3.1 Pro AI model

Tesla

Tesla Cortex 2 at Giga Texas: First Half Set for April Activation

Nvidia outlines AI as five-layer industrial system

Nvidia has described AI as a five-layer industrial system. CEO Jensen detailed the AI layered stack and hinted at the company's next moves. The firm eyes expansion across technology layers, akin to Amazon beyond cloud services.

Bytedance reportedly accesses NVIDIA's latest AI chips outside China

13 mars 2026 Rapporterad av AI

Bytedance, the Chinese parent company of TikTok, is reportedly partnering with a Singapore-based firm to acquire NVIDIA's advanced B200 AI chips for use in Malaysia, bypassing US export restrictions. This arrangement aims to support AI research and development outside China. The project involves significant investment and adheres to export regulations.

5 maj 2026 23:48

Google presenterar TPU 8t- och TPU 8i-chip för agentisk AI

Relaterade artiklar

OpenAI releases GPT-5.4 models for knowledge work

Experts suggest physical AI could lead to AGI

Tesla details AI chip tech and Optimus goals in robotics pivot

TSMC faces growing foundry competition amid AI demand

Google announces Gemini 3.1 Pro AI model

Tesla Cortex 2 at Giga Texas: First Half Set for April Activation

Nvidia outlines AI as five-layer industrial system

Bytedance reportedly accesses NVIDIA's latest AI chips outside China

OpenAI plans to produce 30 million AI phones in 2027-2028

OpenAI rumored to build AI agent smartphone with partners

Intel launches mainstream Core Series 3 (Wildcat Lake) chips on 18A process

Intel to collaborate with Elon Musk on Terafab chip project

HP unveils IQ AI layer and high-performance PCs in New York

Samsung secures $16.5 billion deal with Tesla for AI chips

Chinese transistor breakthrough paves way for future AI chips

Denna webbplats använder cookies