به نظر میرسد گوگل، که از تسلطش بر این جهان راضی نیست، در حال استخدام نیرو برای آزمایشگاه تحقیقاتی DeepMind خود است تا مدلهای تولیدی بسازد که قادر به شبیهسازی جهان فیزیکی باشند. بر اساس لیستهای شغلی مرتبط با این تیم جدید، این پروژه—که توسط تیم بروکس، یکی از سرپرستهایی که به ساخت تولیدکننده ویدئوی OpenAI به نام Sora کمک کرد، هدایت خواهد شد—بخش مهمی از تلاش شرکت برای دستیابی به هوش مصنوعی عمومی خواهد بود.
بروکس، که پس از فرار از OpenAI در اکتبر گذشته به DeepMind پیوست، و تیمش «برنامههای بلندپروازانهای برای ساخت مدلهای تولیدی عظیمی دارند که جهان را شبیهسازی میکنند.» بر اساس توصیف نقشها، تلاش برای ساخت مدلهای جهانی «حوزههای متعددی مانند استدلال بصری و شبیهسازی، برنامهریزی برای عاملهای مجسم، و سرگرمی تعاملی بلادرنگ را تقویت خواهد کرد.» اگر مایل هستید یکی از این نقشها را بر عهده بگیرید، شاید بتوانید بفهمید که این ابهامات به چه معنا هستند و به ما گزارش دهید.
یک مدل جهانی، به سادهترین شکل ممکن، معمولاً سعی میکند نحوه عملکرد واقعی جهان را شبیهسازی کند. مدلهای تولیدی مانند Sora قادرند چیزهایی را که قبلاً در دادههای آموزشی خود دیدهاند، تکرار کنند، اما هیچ درک واقعی از دلیل وقوع آن چیز ندارند. بنابراین میتوانند با موفقیت یک ویدئو از فردی که توپ بیسبال پرتاب میکند تولید کنند، اما هیچ درکی از فیزیک پشت این اتفاق ندارند. مدلهای جهانی هدفشان این است که ماشین را به اطلاعات کافی مجهز کنند تا بتواند نحوه وقوع یک عمل و نتیجه احتمالی آن را تحلیل کند.
یان لوکون، دانشمند ارشد هوش مصنوعی متا، در سخنرانی خود در مجمع هادسون اوایل امسال مدلهای جهانی را اینگونه توصیف کرد: «یک مدل جهانی، مدل ذهنی شما از نحوه رفتار جهان است… شما میتوانید یک سری اقدامات ممکن را تصور کنید، و مدل جهانی شما به شما امکان میدهد پیشبینی کنید که اثر این سری اقدامات بر جهان چه خواهد بود.»
ساختن مدلهای جهانی به دلایل متعددی دشوار است، از جمله حجم عظیم محاسبات مورد نیاز برای اجرای یک مدل و کمبود دادههای آموزشی کافی برای ایجاد یک مدل دقیق، که باعث میشود بیشتر مدلهای جهانی فقط در زمینههای محدود و خاص کارایی داشته باشند.
به نظر میرسد تیم DeepMind قصد دارد مدل جهانی را گسترش دهد. برنامه این است که ابزارهای «تولید تعاملی بلادرنگ» را بر اساس این مدلها بسازند و به طور بالقوه بررسی کنند که چگونه میتوانند مدل جهانی خود را با مدل زبان بزرگ Gemini گوگل ادغام کنند.
هیچ نظری موجود نیست:
ارسال یک نظر