Runway تعلن عن عائلة نماذج العالم GWM-1

كشفت شركة الذكاء الاصطناعي Runway عن GWM-1، مجموعتها الأولية من نماذج العالم المصممة للتوسع خارج توليد الفيديو إلى مجالات مثل الروبوتات والصور الرمزية. مبنية على نموذج النص إلى فيديو Gen-4.5، تمكن هذه النماذج الثلاثة المتخصصة في التنبؤ الذاتي من محاكيات في الوقت الفعلي، وإنشاء بيانات اصطناعية، وتفاعلات طبيعية تشبه الإنسان. يبرز الإطلاق دفعة Runway نحو مجال تنافسي تهيمن عليه عمالقة التكنولوجيا.

Runway، المعروفة بأدواتها لتوليد الفيديو، قدمت GWM-1 كثلاثية من النماذج المدربة بعد ذلك على بيانات محددة للمجال من أساسها Gen-4.5. يشير هذا التحرك إلى توسع الشركة من الصناعات الإبداعية إلى تطبيقات الذكاء الاصطناعي الأوسع.

الأولى، GWM Worlds، توفر واجهة لاستكشاف البيئات الرقمية مع مدخلات مستخدم في الوقت الفعلي تؤثر على توليد الإطارات. يمكن للمستخدمين تحديد عناصر العالم، والمظاهر، وقواعد الفيزياء، والإجراءات مثل حركات الكاميرا أو التغييرات البيئية، مع الحفاظ على التوافق عبر تسلسلات ممتدة. تشمل الاستخدامات المحتملة التمهيد البصري في تطوير الألعاب، وإعدادات الواقع الافتراضي، ومحاكيات تعليمية للمواقع التاريخية. كما تدعم تدريب وكلاء الذكاء الاصطناعي، بما في ذلك تلك الخاصة بالروبوتات.

يركز GWM Robotics على إنتاج بيانات تدريب اصطناعية لتعزيز مجموعات بيانات الروبوتات، مع دمج أجسام جديدة وتعليمات المهام والاختلافات البيئية. يساعد هذا في محاكاة الظروف الواقعية الصعبة مثل الطقس المتغير ويسمح باختبار السياسات بشكل أكثر أمانًا واقتصادًا في الإعدادات الافتراضية قبل التجارب الجسدية. تقدم Runway SDK بلغة Python لـAPI الروبوتات على أساس الطلب.

يدمج GWM Avatars توليد الفيديو والكلام لإنشاء صور رمزية تتحرك وتعبر عن العواطف بشكل طبيعي أثناء الكلام والاستماع، مع الحفاظ على محادثات طويلة دون فقدان الجودة. سيتكامل قريبًا في تطبيق الويب وAPI الخاص بـRunway.

بينما تسعى إلى نماذج أكثر توحيدًا عبر المجالات، فإن الإصدارات الحالية لـRunway متميزة. وصف الرئيس التنفيذي Cristóbal Valenzuela GWM-1 على X بأنه "خطوة كبيرة نحو المحاكاة العالمية". تدخل الشركة مساحة مزدحمة مع لاعبين مثل Google وNvidia، مستهدفة الروبوتات والفيزياء وعلم الحياة إلى جانب الأفلام والألعاب.

بالإضافة إلى ذلك، كشفت Runway عن تحديثات Gen-4.5 مع صوت أصلي وتحرير صوت وقدرات فيديو متعدد اللقطات، بالإضافة إلى شراكة مع CoreWeave لرفوف Nvidia GB300 NVL72 لدعم تدريب الذكاء الاصطناعي واستنتاجه المستقبلي.

مقالات ذات صلة

Photorealistic illustration depicting OpenAI's ChatGPT Images 2 launch, with AI generating text-rich infographics on a laptop screen.
صورة مولدة بواسطة الذكاء الاصطناعي

OpenAI launches ChatGPT Images 2 image generation model

من إعداد الذكاء الاصطناعي صورة مولدة بواسطة الذكاء الاصطناعي

OpenAI announced ChatGPT Images 2, its new AI image model, on Tuesday. The upgrade focuses on creating text-heavy professional visuals like infographics and study guides. It rolls out to all ChatGPT users with generation limits based on subscription plans.

Shanghai-based Fysics AI announced the launch of Fysiverse on Wednesday, a new-generation physics-based world model.

من إعداد الذكاء الاصطناعي

California-based Generalist AI has launched Gen-1, a new physical AI model that enables robots to handle tasks like folding laundry, fixing other robots and stuffing cash into wallets. The model draws on human dexterity data collected worldwide to teach robots 'physical common sense.' Co-founder Pete Florence described it as a major advance for real-world robotics.

OpenAI has launched GPT-Rosalind, a large language model trained specifically on biology workflows. The model, named after scientist Rosalind Franklin, aims to address challenges in handling massive biological datasets and specialized subfields. Access is currently limited to US-based entities due to safety concerns.

يستخدم هذا الموقع ملفات تعريف الارتباط

نستخدم ملفات تعريف الارتباط للتحليلات لتحسين موقعنا. اقرأ سياسة الخصوصية الخاصة بنا سياسة الخصوصية لمزيد من المعلومات.
رفض