Googleがエージェント型AI向けの新チップ「TPU 8t」と「TPU 8i」を発表

Googleは、同社が提唱する「AIエージェント時代」を見据え、学習用チップ「TPU 8t」と推論用チップ「TPU 8i」という2種類の新型Tensor Processing Unitを発表しました。これら第8世代のチップは2025年の「Ironwood」TPUの後継にあたり、AI開発のさらなる高速化と効率化を目指しています。このハードウェアにより、大規模モデルの学習期間を数ヶ月から数週間に短縮することが期待されています。

Googleは火曜日、AIモデルのライフサイクルの各段階に特化したアクセラレータとして「TPU 8t」と「TPU 8i」を発表しました。TPU 8tは最先端モデルの学習に焦点を当てており、9,600基のチップと2ペタバイトの共有広帯域メモリを搭載した新しいサーバークラスター「ポッド」を採用しています。Googleによると、これらのポッドは121 FP4 EFlopsの演算能力を提供し、前世代のIronwoodと比較して約3倍の性能を実現しており、単一クラスターで最大100万チップまでリニアに拡張可能です。同社は、改善されたメモリ管理、自動障害管理、チップ間のリアルタイムテレメトリにより、97%の「グッドプート(有効な計算量)」を達成し、時間と労力の無駄を削減できると主張しています。また、大規模AIモデルの学習時間が数ヶ月から数週間に短縮される見込みです。一方、TPU 8iは学習済みモデルが応答を生成する推論フェーズを担います。これらのチップは1,152基のポッドで構成され、1ポッドあたり11.6 EFlopsの性能を提供します。各TPU 8iはオンチップSRAMを従来の3倍となる384MBに拡大しており、より長いコンテキストウィンドウを持つモデルに対して大規模なキーバリューキャッシュを実現しました。初めての試みとして、これらのチップはGoogle独自のARM CPU「Axion」と専用ペアリングされ、TPU 2基に対してCPU 1基を組み合わせる構成を採用しています。これにより、従来のx86セットアップでTPU 4基を制御していた構成と比較して、全体的な効率が向上したとGoogleは説明しています。効率の向上は電力と冷却にも及びます。新型TPUのワットあたりの性能はIronwoodの2倍となり、ネットワークとコンピューティングを統合したデータセンター設計では、電力あたりの計算能力が6倍に高まりました。液冷システムにはアクティブ制御バルブが導入され、ワークロードに合わせて水流を調整することが可能です。これらのチップはGoogleのGeminiベースのエージェントをサポートし、JAX、MaxText、PyTorch、SGLang、vLLMといったフレームワークを通じてサードパーティの開発者にも提供される予定です。このニュースを受け、NVIDIAの株価は一時1.5%下落しましたが、その後回復しました。

関連記事

Photorealistic image from Google's Android Show featuring Gemini AI and new Googlebooks laptops with connected devices.
AIによって生成された画像

GoogleがGemini Intelligenceと新型ノートPC「Googlebooks」を発表

AIによるレポート AIによって生成された画像

Googleは火曜日に開催された「Android Show」プレゼンテーションにおいて、Androidデバイス向けAI駆動のアップデートを一挙に発表し、新しいノートPCシリーズ「Googlebooks」を初公開した。今回の発表は、Gemini IntelligenceによるプロアクティブなAI機能と、スマートフォン、車載システム、コンピューター間での統合強化に重点を置いている。

Intelは年内に、AI推論タスク向けに設計された新しいGPUを出荷する。このチップは低コストのメモリと空冷システムを採用することで、競合するNvidiaやAMDよりも低価格を実現する。

AIによるレポート

Start-up Tensordyne has secured letters of intent worth more than 200 million dollars for its semiconductors. Fifteen data center operators are interested in the chips, which are said to consume far less energy than Nvidia products.

2024年にサンフランシスコで設立されたスタートアップ企業Physical Intelligenceは、大規模言語モデルから派生した「視覚・言語・行動(vision-language-action)」モデルを活用し、複数のタスクを学習するロボット制御システムの開発を進めている。同社は、口頭の指示に基づいてコーヒーを淹れる、洗濯物をたたむ、サツマイモを調理するといった様々な作業を行うロボットを披露した。

このウェブサイトはCookieを使用します

サイトを改善するための分析にCookieを使用します。詳細については、プライバシーポリシーをお読みください。
拒否