AnthropicがClaude Sonnet 4.5 AIモデルをリリース
Anthropicは最新のAIモデルClaude Sonnet 4.5をリリースし、現実世界のアプリケーションで優れていると主張しています。このモデルは、複雑な多段階タスクで最大30時間の持続的な集中力を示しました。OpenAIを含む独立したベンチマークでは、実務的な業務シナリオで競合他社を上回っています。
AI研究のリーディングカンパニーであるAnthropicは、Claude Sonnet 4.5の利用可能性を発表し、コーディング、コンピュータインタラクション、エージェントベースのシステムなどの実用的用途でトップパフォーマーとして位置づけました。Anthropicの報告によると、このモデルは多段階タスクを処理しながら30時間の集中力を維持し、長期ワークフローのAI耐久性における重要な進歩です。
このリリースは、Claude Sonnet 4.5の現実世界のエージェントにおける強みを強調しており、複雑なプロセスのより信頼性の高い自動化を可能にします。TechRadarはこれを「現実世界のエージェント、コーディング、コンピュータ使用のための世界最高のAIモデル」と記述し、Anthropicのプラットフォーム経由でのユーザーへの即時利用可能性を強調しています。
さらなる検証はOpenAIの研究から得られ、AIモデルを現実世界の業務タスクでテストしました。これらの評価では、ClaudeはGPT-5、Gemini、Grokを含む競合他社を上回り、特に実用的適用と持続的なパフォーマンスを必要とするシナリオで優位でした。TechRepublicは発売を報道し、堅牢なAIツールを求める開発者と企業への影響を指摘しています。
Anthropicの背景は、安全で解釈可能なAIシステムへの焦点を強調しています。元OpenAI幹部によって設立された同社は、Claudeシリーズを反復的に改善してきました。Sonnet 4.5は、長期タスク処理の制限に対処するために以前のバージョンを基にしています。ソース全体で「今すぐ利用可能」以外の具体的なリリース日は詳細化されていませんが、Ars Technicaの2025年9月のタイミングは、進行中のAI進歩と一致します。
Anthropicの代表からの直接的な引用はソースで提供されていませんが、同社の声明は信頼性を強調しています:このモデルは、拡張期間にわたって一貫性を失うことなく「多段階タスク」のために設計されています。ベンチマークは明確なリードを示していますが、ソースはコーディングとエージェンタスクでの優位性に同意しており、AI倫理と展開のより広範な影響は将来の精査の領域です。
この発売は、AIにおける激化する競争の中で起こっており、モデルは生のベンチマークではなく現実世界の有用性でますます評価されています。Anthropicのアプローチは、焦点を当てたエージェント機能を優先し、企業がAIを日常業務に統合する方法に潜在的に影響を与えます。