Google perkenalkan chip TPU 8t dan TPU 8i untuk AI agentik

Rabu, 22 April 2026

Dilaporkan oleh AI

Google telah meluncurkan dua Tensor Processing Unit baru, yakni TPU 8t untuk pelatihan dan TPU 8i untuk inferensi, yang menyasar apa yang disebut perusahaan tersebut sebagai era AI agentik. Chip generasi kedelapan ini merupakan penerus Ironwood TPU dari tahun 2025 dan menjanjikan pengembangan AI yang lebih cepat dan efisien. Perangkat keras ini bertujuan untuk memangkas waktu pelatihan model berskala besar dari hitungan bulan menjadi minggu.

Google mengumumkan TPU 8t dan TPU 8i pada hari Selasa, memposisikannya sebagai akselerator khusus untuk tahapan yang berbeda dalam siklus hidup model AI. TPU 8t berfokus pada pelatihan model perbatasan, dengan klaster server terbaru yang disebut pod yang menampung 9.600 chip dan dua petabyte memori bandwidth tinggi bersama. Google menyatakan bahwa pod ini memberikan komputasi sebesar 121 FP4 EFlops, hampir tiga kali lipat lebih tinggi dibandingkan generasi Ironwood sebelumnya, dan dapat berskala secara linear hingga satu juta chip dalam satu klaster. Perusahaan mengklaim tingkat 'goodpute' mencapai 97 persen, berkat penanganan memori yang ditingkatkan, manajemen kesalahan otomatis, dan telemetri waktu nyata di seluruh chip, sehingga mengurangi waktu dan upaya yang terbuang. Waktu pelatihan untuk model AI masif diperkirakan akan turun dari bulan menjadi minggu, ungkap Google. TPU 8i menangani inferensi, fase di mana model yang telah dilatih menghasilkan respons. Chip ini beroperasi dalam pod yang lebih besar berisi 1.152 unit, menyediakan 11,6 EFlops per pod. Setiap TPU 8i memiliki SRAM di dalam chip tiga kali lipat lebih besar yaitu 384 MB, yang memungkinkan cache key-value yang lebih besar untuk model dengan jendela konteks yang diperluas. Untuk pertama kalinya, chip ini dipasangkan secara eksklusif dengan CPU ARM Axion kustom Google, menggunakan satu CPU untuk setiap dua TPU, yang menurut Google meningkatkan efisiensi keseluruhan dibandingkan pengaturan x86 sebelumnya yang melayani empat TPU. Peningkatan efisiensi juga mencakup daya dan pendinginan. TPU baru ini menawarkan performa per watt dua kali lipat lebih baik dibandingkan Ironwood, sementara desain pusat data yang mengintegrasikan jaringan dan komputasi telah meningkatkan daya komputasi per unit listrik sebanyak enam kali lipat. Pendinginan cair kini menggunakan katup yang dikontrol secara aktif untuk menyesuaikan aliran air dengan beban kerja. Chip ini akan mendukung agen berbasis Gemini milik Google serta pengembang pihak ketiga melalui kerangka kerja seperti JAX, MaxText, PyTorch, SGLang, dan vLLM. Saham Nvidia sempat turun 1,5 persen sesaat setelah berita ini muncul namun kembali pulih.

OpenAI releases GPT-5.4 models for knowledge work

Jumat, 06 Maret 2026 Dilaporkan oleh AI Gambar dihasilkan oleh AI

OpenAI has launched GPT-5.4, including variants Thinking and Pro, aimed at improving agentic tasks and knowledge work. The update features enhanced computer-use capabilities and reduced factual errors, amid competition from Anthropic following a US defense deal controversy. The models are available immediately to paid users and developers.

Google perkenalkan chip TPU 8t dan TPU 8i untuk AI agentik

Artikel Terkait

OpenAI releases GPT-5.4 models for knowledge work

Experts suggest physical AI could lead to AGI

Tesla details AI chip tech and Optimus goals in robotics pivot

TSMC faces growing foundry competition amid AI demand

Google announces Gemini 3.1 Pro AI model

Tesla Cortex 2 at Giga Texas: First Half Set for April Activation

Nvidia outlines AI as five-layer industrial system

Bytedance reportedly accesses NVIDIA's latest AI chips outside China

OpenAI plans to produce 30 million AI phones in 2027-2028

OpenAI rumored to build AI agent smartphone with partners

Intel launches mainstream Core Series 3 (Wildcat Lake) chips on 18A process

Intel to collaborate with Elon Musk on Terafab chip project

HP unveils IQ AI layer and high-performance PCs in New York

Samsung secures $16.5 billion deal with Tesla for AI chips

Chinese transistor breakthrough paves way for future AI chips

Situs web ini menggunakan cookie